Page Nav

GRID_STYLE

Efek

TRUE

Classic Header

{fbt_classic_header}

Son Dakika:

latest

Yapay Zeka Söz konusu olduğunda, Veri Kümelerinden Kurtulabilir miyiz

Yapay Zeka Söz konusu olduğunda, Veri Kümelerinden Kurtulabilir miyiz?  Makine Öğrenimi Modellerinin Eğitimi için Sentetik Verilerin Kullanı...


Yapay Zeka Söz konusu olduğunda, Veri Kümelerinden Kurtulabilir miyiz? Makine Öğrenimi Modellerinin Eğitimi için Sentetik Verilerin Kullanılması

Bir araştırmaya göre, sentetik veriler kullanılarak eğitilen bir görüntü sınıflandırması için bir makine öğrenimi modeli, gerçek şey üzerinde eğitilmiş olanla rekabet edebilir.

Doğal bir felaketin ardından uydu fotoğraflarındaki hasarın belirlenmesi gibi görüntü sınıflandırma görevlerini gerçekleştirmek üzere makine öğrenimi modellerini eğitmek için büyük miktarda veriye ihtiyaç vardır. Ancak, bu verilere ulaşmak her zaman kolay değildir. İlk etapta kullanılabilir veriler varsa, veri kümelerinin üretilmesi milyonlarca dolara mal olabilir ve en iyi veri kümeleri bile genellikle bir modelin performansını olumsuz yönde etkileyen önyargılar içerir.

MIT araştırmacıları , veri kümeleri tarafından sunulan bazı sorunları aşmak için, bir veri kümesi kullanmak yerine, son derece gerçekçi sentetik veriler üretmek için özel bir tür makine öğrenimi modeli kullanan bir makine öğrenimi modelini eğitmek için bir yöntem geliştirdiler. aşağı akış vizyon görevleri.

Elde ettikleri sonuçlar, yalnızca bu sentetik veriler kullanılarak eğitilen bir karşılaştırmalı temsil öğrenme modelinin, gerçek verilerden öğrenilenlerle rekabet eden ve hatta onlardan daha iyi performans gösteren görsel temsilleri öğrenebildiğini göstermektedir.

Sentetik Veri Oluşturmak İçin Üretken Makine Öğrenimi Modeli

MIT araştırmacıları, görüntü sınıflandırması için başka bir modeli eğitmek için kullanılabilecek gerçek verilere dayalı sentetik veriler oluşturmak için üretken bir makine öğrenme modelinin kullanımını gösterdi. Bu görüntü, üretken modelin dönüştürme yöntemlerinin örneklerini gösterir. Kredi: Araştırmacıların izniyle

Üretken model olarak bilinen bu özel makine öğrenimi modeli, depolamak veya paylaşmak için bir veri kümesinden çok daha az bellek gerektirir. Sentetik verilerin kullanılması ayrıca, bazı gerçek verilerin nasıl dağıtılabileceğini sınırlayan gizlilik ve kullanım haklarıyla ilgili bazı endişeleri ortadan kaldırma potansiyeline sahiptir. Geleneksel veri kümelerinde var olan bazı önyargıları ele alabilecek ırk veya cinsiyet gibi belirli özellikleri kaldırmak için üretken bir model de düzenlenebilir.

“Bu yöntemin eninde sonunda işe yarayacağını biliyorduk; sadece bu üretken modellerin giderek daha iyi hale gelmesini beklememiz gerekiyordu. Ancak bu yöntemin bazen gerçek şeyden bile daha iyi sonuç verdiğini gösterdiğimizde özellikle memnun olduk," diyor Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı'nda (CSAIL) araştırmacı bilim adamı ve makalenin başyazarı Ali Jahanian.

Jahanian, makaleyi CSAIL lisansüstü öğrencileri Xavier Puig ve Yonglong Tian ve Elektrik Mühendisliği ve Bilgisayar Bilimleri Bölümü'nde yardımcı doçent olan kıdemli yazar Phillip Isola ile birlikte yazdı. Araştırma, Uluslararası Öğrenme Temsilleri Konferansı'nda sunulacaktır.

Sentetik veri oluşturma

Üretken bir model bir kez gerçek veriler üzerinde eğitildikten sonra, gerçek şeyden neredeyse ayırt edilemeyecek kadar gerçekçi sentetik veriler üretebilir. Eğitim süreci, belirli bir sınıftaki nesneleri (arabalar veya kediler gibi) içeren milyonlarca görüntünün üretici modelini göstermeyi içerir ve daha sonra benzer nesneler oluşturabilmesi için bir araba veya kedinin neye benzediğini öğrenir.

Jahanian, temel olarak, bir anahtarı çevirerek, araştırmacıların, modelin eğitim veri setindekilere dayanan benzersiz, gerçekçi görüntülerin sabit bir akışını sağlamak için önceden eğitilmiş bir üretici modeli kullanabileceklerini söylüyor.

Ancak üretken modeller daha da faydalıdır çünkü eğitildikleri temel verileri nasıl dönüştüreceklerini öğrenirler. Model, araba resimleri üzerinde eğitilirse, bir arabanın farklı durumlarda (eğitim sırasında görmediği durumlarda) nasıl görüneceğini "hayal edebilir" ve ardından arabayı benzersiz pozlarda, renklerde veya boyutlarda gösteren görüntülerin çıktısını alabilir.

Aynı görüntünün birden fazla görünümüne sahip olmak, hangi çiftlerin benzer veya farklı olduğunu öğrenmek için bir makine öğrenimi modelinin birçok etiketlenmemiş görüntünün gösterildiği, karşılaştırmalı öğrenme adı verilen bir teknik için önemlidir.

Araştırmacılar, önceden eğitilmiş bir üretici modeli, iki modelin otomatik olarak birlikte çalışmasına izin verecek şekilde karşılaştırmalı bir öğrenme modeline bağladılar. Jahanian, karşılaştırmalı öğrenicinin üretici modele bir nesnenin farklı görünümlerini üretmesini ve ardından bu nesneyi birden çok açıdan tanımlamayı öğrenebileceğini açıklıyor.

“Bu, iki yapı taşını birbirine bağlamak gibiydi. Üretken model bize aynı şey hakkında farklı görüşler verebileceğinden, karşılaştırmalı yöntemin daha iyi temsilleri öğrenmesine yardımcı olabilir” diyor.

Gerçek şeyden bile daha iyi

Araştırmacılar, yöntemlerini gerçek veriler kullanılarak eğitilmiş diğer birkaç görüntü sınıflandırma modeliyle karşılaştırdılar ve yöntemlerinin diğer modellerden daha iyi ve bazen daha iyi performans gösterdiğini buldular.

Üretken bir model kullanmanın bir avantajı, teorik olarak sonsuz sayıda örnek oluşturabilmesidir. Böylece araştırmacılar, örnek sayısının modelin performansını nasıl etkilediğini de incelediler. Bazı durumlarda, daha fazla sayıda benzersiz örnek üretmenin ek iyileştirmelere yol açtığını buldular.

"Bu üretken modellerle ilgili harika olan şey, onları sizin için başka birinin eğitmiş olmasıdır. Bunları çevrimiçi depolarda bulabilirsiniz, böylece herkes bunları kullanabilir. İyi temsiller elde etmek için modele müdahale etmenize gerek yok” diyor Jahanian.

Ancak üretken modelleri kullanmanın bazı sınırlamaları olduğuna dikkat çekiyor. Bazı durumlarda, bu modeller, gizlilik riskleri oluşturabilecek kaynak verileri ortaya çıkarabilir ve uygun şekilde denetlenmezlerse, eğitildikleri veri kümelerindeki önyargıları artırabilir.

O ve işbirlikçileri, gelecekteki çalışmalarda bu sınırlamaları ele almayı planlıyor. Keşfetmek istedikleri başka bir alan da, bu tekniği makine öğrenimi modellerini geliştirebilecek köşe vakaları oluşturmak için kullanmaktır. Köşe vakaları genellikle gerçek verilerden öğrenilemez. Örneğin, araştırmacılar kendi kendini süren bir araba için bir bilgisayarlı görüntü modeli eğitiyorlarsa, gerçek veriler bir köpeğin ve sahibinin bir otoyolda koştuğu örnekleri içermeyecek ve bu nedenle model bu durumda ne yapacağını asla öğrenemeyecek. Bu temel durum verilerini sentetik olarak oluşturmak, bazı yüksek riskli durumlarda makine öğrenimi modellerinin performansını iyileştirebilir.

Araştırmacılar ayrıca, daha da karmaşık görüntüler oluşturabilmeleri için üretken modelleri geliştirmeye devam etmek istiyorlar, diyor.

Referans: Ali Jahanian, Xavier Puig, Yonglong Tian ve Phillip Isola tarafından “Çoklu Görünümlü Temsil Öğrenimi için Veri Kaynağı Olarak Üretken Modeller”.
PDF

Bu araştırma, kısmen MIT-IBM Watson AI Lab, Birleşik Devletler Hava Kuvvetleri Araştırma Laboratuvarı ve Birleşik Devletler Hava Kuvvetleri Yapay Zeka Hızlandırıcısı tarafından desteklenmiştir.

Hiç yorum yok