Açık Fikir Sağduyu - Open Mind Common Sense

Açık Fikir Sağduyu (OMCS) bir yapay zeka dayalı proje Massachusetts Teknoloji Enstitüsü (MIT) Medya Laboratuvarı amacı büyük bir sağduyu bilgi tabanı Web'deki binlerce kişinin katkılarından.

1999'da kurulduğundan bu yana, diğer dillerdeki bilgi tabanlarına ek olarak 15.000'den fazla katılımcıdan bir milyondan fazla İngilizce gerçek biriktirmiştir. OMCS'nin yazılımlarının çoğu, birbiriyle bağlantılı üç temsil üzerine inşa edilmiştir: insanların doğrudan etkileşime girdiği doğal dil külliyatı, adı verilen bu külliyattan oluşturulan anlamsal bir ağ ConceptNetve ConceptNet olarak adlandırılan matris tabanlı bir temsil Analoji Uzay boyutsallık azaltmayı kullanarak yeni bilgiler çıkarabilir.[1] Open Mind Common Sense tarafından toplanan bilgiler, MIT'de ve başka yerlerde araştırma projelerine olanak sağlamıştır.

Tarih

Proje, Marvin Minsky, Push Singh, Catherine Havasi, ve diğerleri. Geliştirme çalışmaları Eylül 1999'da başladı ve proje bir yıl sonra internete açıldı. Havasi, tezinde bunu "İnternetin dağıtılmış insan bilgi işlem gücünden yararlanma girişimi, o zamanlar daha erken aşamalarında olan bir fikir" olarak tanımladı.[2] Orijinal OMCS, web sitesinden etkilendi Herşey2 ve selefi ve esinlenen minimalist bir arayüz sundu. Google.

Push Singh'in profesör olması planlanıyordu. MIT Media Lab 2007'de Common Sense Computing grubuna 28 Şubat 2006 Salı günkü intiharına kadar liderlik etti.[3]

Proje şu anda Catherine Havasi altında MIT Media Lab'de Digital Intuition Group tarafından yürütülüyor.[kaynak belirtilmeli ]

Veritabanı ve web sitesi

OMCS'de birçok farklı bilgi türü vardır. Bazı ifadeler, doğal dilin basit ifadeleri olarak ifade edilen nesneler veya olaylar arasındaki ilişkileri aktarır: Bazı örnekler arasında "Ceket sıcak tutmak için kullanılır", "Güneş çok sıcak" ve "Akşam yemeğini pişirirken yaptığınız son şey şudur: bulaşıklarınızı yıkayın ". Veritabanında ayrıca, "Arkadaşlarla vakit geçirmek mutluluk getirir" ve "Bir araba enkazına girmek insanı kızdırır" gibi ifadelerde durumların duygusal içeriği hakkında bilgiler de içermektedir. OMCS, "İnsanlar şüphelenmek ister" ve "İnsanlar iyi kahve ister" gibi, hem büyük hem de küçük insanların arzuları ve hedefleri hakkında bilgiler içerir.[1]

Başlangıçta, bu ifadeler Web sitesine, daha sonra ayrıştırılması gereken, kısıtlanmamış metin cümleleri olarak girilebilirdi. Güncel sürümü internet sitesi yalnızca daha yapılandırılmış boş doldurma şablonlarını kullanarak bilgi toplar. OMCS ayrıca, Amacı Olan Oyun "Ayrıntı düzeyi ".[4]

Doğal haliyle, OMCS veritabanı, bazı genel bilgileri aktaran bu kısa cümlelerin bir koleksiyonudur. Bu bilgiyi hesaplamalı olarak kullanmak için daha yapısal bir temsile dönüştürülmesi gerekir.

ConceptNet

ConceptNet bir anlamsal ağ OMCS veri tabanındaki bilgilere göre. ConceptNet, düğümleri kavram olan ve kenarları bu kavramlar hakkında sağduyu iddiaları olan yönlendirilmiş bir grafik olarak ifade edilir. Kavramlar, isim cümleleri, fiil cümleleri, sıfat cümleleri veya tümceler olabilen yakından ilişkili doğal dil cümleleri kümelerini temsil eder.[5]

ConceptNet, OMCS'deki doğal dil iddialarından, bunları sığ bir ayrıştırıcı kullanarak modellerle eşleştirerek oluşturulur. İddialar, sınırlı bir olasılıklar kümesinden seçilen iki kavram arasındaki ilişkiler olarak ifade edilir. Çeşitli ilişkiler OMCS külliyatında bulunan yaygın cümle kalıplarını temsil eder ve özellikle bilgi toplama Web sitesinde kullanılan her "boşlukları doldur" şablonu belirli bir ilişkiyle ilişkilendirilir.[5]

ConceptNet'i oluşturan veri yapıları, 2007 yılında önemli ölçüde yeniden düzenlendi ve ConceptNet 3 olarak yayınlandı.[5] Yazılım Aracıları grubu şu anda yeni sürüm 4.0 için bir veritabanı ve API dağıtmaktadır.[6]

OMCS'nin kurucu ortağı ve yöneticisi Catherine Havasi, Robyn Speer, Dennis Clark ve Jason Alonso ile birlikte 2010 yılında Luminoso ConceptNet üzerine kurulmuş bir metin analizi yazılım şirketi.[7][8][9][10] İşletmelerin anketler, ürün incelemeleri ve sosyal medya dahil olmak üzere büyük miktarda nitel veriyi anlamalarına ve bunlardan içgörü elde etmelerine yardımcı olmak için ConceptNet'i birincil sözcük kaynağı olarak kullanır.[7][11][12]

Makine öğrenimi araçları

ConceptNet'teki bilgiler, aşağıdakiler için bir temel olarak kullanılabilir: makine öğrenme algoritmalar. AnalogySpace adlı bir temsil, tekil değer ayrışımı AI uygulamalarında kullanılabilecek bir şekilde inConceptNet'teki bilgi kalıplarını genelleştirmek ve temsil etmek. Yaratıcıları, Divisi adlı bir Python makine öğrenimi araç seti dağıtır [13] metin gövdesine, ConceptNet gibi yapılandırılmış bilgi tabanlarına ve ikisinin kombinasyonlarına dayalı makine öğrenimi gerçekleştirmek için.

Diğer projelerle karşılaştırma

Diğer benzer projeler şunları içerir: Asla Bitmeyen Dil Öğrenimi, Mindpixel (üretilmiyor), Döngü, Öğrenci, SenticNet, Freebase, YAGO, DBpedia ve bilgi toplamak ve katılım için teşvik sağlamak için alternatif yaklaşımları araştıran Açık Fikir 1001 Soruları.

Open Mind Common Sense projesi Cyc'den farklıdır çünkü topladığı sağduyu bilgisini resmi bir mantıksal yapı kullanmak yerine İngilizce cümleler olarak temsil etmeye odaklanmıştır. ConceptNet, yaratıcılarından biri olan Hugo Liu tarafından daha çok benzer şekilde yapılandırılmış olarak tanımlanıyor WordNet "biçimsel dilsel titizlik yerine gayri resmi kavramsal bağlılığa yaptığı vurgu" nedeniyle Cyc'e göre.[14]

Ayrıca, São Carlos Federal Üniversitesi’ndeki Gelişmiş Etkileşim Laboratuvarı tarafından yönetilen Brezilya’da Açık Zihin Sağduyu (OMCS-Br) adlı Brezilya girişimi de var (LIA-UFSCar ). Bu proje 2005 yılında, MIT Media Lab'deki Software Agents Group ile işbirliği içinde başlatılmıştır, ana hedef Brezilya Portekizcesi olarak ifade edilen sağduyu toplamak ve geliştirmek için kullanmaktır. kültürel hassaslık Kültürel profillerin bilgilerini ConceptNet'ten çıkarmaya dayalı yazılım uygulamaları. Bu, geliştiricilere ve kullanıcılara kültürel olarak bağlamsallaştırılmış bir içerik yazılımıyla yardımcı olmayı ve nihai uygulamaları daha esnek, uyarlanabilir, erişilebilir ve kullanılabilir hale getirmeyi amaçlamaktadır. Ana uygulamaların odak noktası eğitim ve sağlıktır.[kaynak belirtilmeli ]

Ayrıca bakınız

Referanslar

  1. ^ a b Robyn Speer, Catherine Havasi ve Henry Lieberman. AnalojiSpace: Sağduyu Bilgisinin Boyutunu Azaltma Arşivlendi 2010-07-09'da Wayback Makinesi. AAAI 2008.
  2. ^ Catherine Havasi. Tekil Değer Ayrışımına Dayalı Teknikleri Kullanarak Anlamsal İlişkileri Keşfetmek. Doktora Tezi, Brandeis Üniversitesi, Haziran 2009.
  3. ^ MIT Haber Ofisi (2006-03-08). "Anma töreni yarın Pushpinder Singh için planlanıyor". MIT Tech Talk. Alındı 2009-10-07.
  4. ^ "Ayrıntı profili". Açık Fikir Ortak Duygusu. Arşivlenen orijinal 2010-06-25 tarihinde.
  5. ^ a b c Catherine Havasi, Robyn Speer ve Jason Alonso. ConceptNet 3: Sağduyu Bilgisi için Esnek, Çok Dilli Bir Anlamsal Ağ. Doğal Dil İşlemede Son Gelişmelerin Bildirileri, 2007. deneyin ConceptNet 3: ... Arşivlendi 2015-05-29'da Wayback Makinesi
  6. ^ Commonsense Computing Initiative (2009-02-24). "Launchpad'de ConceptNet API". Alındı 2009-10-07.
  7. ^ a b Lohr, Steve (27 Haziran 2014). "Sosyal Medya Lensiyle ABD-Almanya Maçı". New York Times. Alındı 3 Mart 2015.
  8. ^ Rusli, Evelyn (14 Nisan 2014). "Firmalar, Alışveriş Yapanların Görüşlerine Dokunmak İçin Yapay Zekayı Kullanıyor". Wall Street Journal. Alındı 3 Mart 2015.
  9. ^ Alba, Davey (12 Şubat 2015). "Twitter Chatter'ı Gerçek Zamanlı Olarak Analiz Etmenize Yardımcı Olan Başlangıç". Kablolu. Alındı 3 Mart 2015.
  10. ^ Noyes, Katherine (11 Şubat 2015). "İşletmeler için Luminoso: İşte tüm bu gevezeliklerin gerçekte ne anlama geldiği burada". bilgisayar Dünyası. Alındı 3 Mart 2015.
  11. ^ Miller, Ron (2 Temmuz 2014). "Luminoso, Bulut Metin Analizi Hizmeti Oluşturmaya Devam Etmek İçin Seri A'ya 6,5 ​​Milyon Dolarlık Geldi". TechCrunch. Alındı 3 Mart 2015.
  12. ^ Darrow, Barb (11 Şubat 2015). "Luminoso, metin analizi zekasını veri akışına getiriyor". GigaOm. Alındı 3 Mart 2015.
  13. ^ Commonsense Computing Initiative (2009-02-24). "Launchpad'de Divisi". Alındı 2009-10-07.
  14. ^ "ConceptNet Projesi V2.1". Alındı 2008-12-17.

Dış bağlantılar