Knowledge Vault: Google buduje nową bazę wiedzy 2.0

Knowledge Vault

Google buduje największą bazę wiedzy wszech czasów. Rozszerza swoje dotychczasowe osiągnięcia w postaci Grafu Wiedzy (Knowledge Graph) i rozpoczyna pracę nad Knowledge Vault Informacje o nowym projekcie zostały ujawnione podczas konferencji Knowledge Discovery in Databases w Nowym Jorku.


Festiwal SEO 2018 Katowice

W tym wyścigu o miano pierwszego, który skataloguje i poukłada całą wiedzę ludzkości biorą udział również Microsoft, Facebook, Amazon i IBM rozwijając podobne systemy do Knowledge Vault. Oryginalna praca jest dostępna pod tytułem Knowledge Vault: A Web-Scale Approach to Probabilistic Knowledge Fusion.

Inżynierowie z Google zaprezentowali w niej Knowledge Vault, system który automatycznie zbiera i kompiluje informacje do postaci bazy danych na dużą skalę.

Jeśli zajmujesz się SEO, z pewnością znasz Freebase, jedno z obecnych źródeł z którego Google czerpie fakty do osobach, obiektach i przedsiębiorstwach, które wyświetlają się jako elementy Grafu Wiedzy w wynikach wyszukiwania. Google zakupiło Freebase w 2010 roku i była to wtedy największa baza wiedzy edytowana przez człowieka.

Freebase to zestaw strukturyzowanych danych zebranych z takich systemów jak Wikipedia i zarządzanych przez społeczność w podobny sposób do społeczności Wikipedii. Różnica miedzy Wikipedią polega na sposobie dostępu do danych. Freebase oferuje szeroką gamę dostępów przez API.

Zakup Freebase przez Google był kamieniem milowym w budowie własnego systemu, który mógłby rozumieć połączenia między obiektami. Problem jaki Google ma z Freebase polega na dostępie do integralnych danych, który obecnie uzależniony jest od zewnętrznych źródeł. Z pomocą algorytmów zaawansowanego uczenia maszynowego nowo powstały system jest w stanie obliczyć prawdopodobieństwo trafności określonej informacji oraz przetworzyć i scalić nowe informacje w ogromnej skali.

Zagłębiając się w techniczne szczegóły nowego systemu będzie on korzystał z takich dziedzin jak wiedza o wydobywaniu informacji, przetwarzanie języka naturalnego i uczenie maszynowe.

Jednym z prostszych rozwiązań na podstawie którego Google będzie określać przydatność wiedzy jest crowd sourcing. M.in. realizowane jest to przez umieszczenie przycisku z prośbą o przesłanie opinii pod obecnie zamieszczanymi faktami w Grafie Wiedzy.

Po co Google jest Knowledge Vault?

Od czasu wprowadzenie Grafu Wiedzy do wyników wyszukiwania, Google zebrało mnóstwo opinii na temat wyświetlanych informacji. Po wprowadzeniu Kolibra, powstały nowe możliwości przetwarzania zapytań i treści ze szczególnym uwzględnieniem rozpoznawania obiektów jak osoby, miejsca, przedsiębiorstwa i produkty. Jakość danych we Freebase nie jest wystarczająca, np. 75% osób edytujących dane nie ma przypisanej narodowości do swojego imienia.

W tym momencie Knowledge Vault posiada 302 miliony faktów z prawdopodobieństwem poprawności 0,9 (0 jest fałszywe, 1 jest prawdziwe), natomiast Freebase ma 637 milionów faktów. Jednak tylko 223 milionów faktów się w tej bazie zgadza, czyli ok. 35% z nich jest poprawne. Nie powinno zatem dziwić, że 2 tygodnie temu Google ogłosiło zamknięcie Freebase i migrację całej obecnej wiedzy i narzędzi do Wikidata.

Wyszukiwanie spersonalizowane staje się coraz bardziej użyteczne, systemy sztucznej inteligencji są rozwijane, algorytmy korzystające z faktów pracują szybciej i dokładniej w porównaniu do niezweryfikowanej informacji. Wirtualni asystenci tacy jak Google Now będę zdolni odpowiedź na wszystkie pytania korzystając z tego systemu. Zapytania eksplorujące (np. Co można zwiedzić w Warszawie? Co można robić w Krakowie?) będą bardziej dokładne, a wzbogacone wyniki wyszukiwania takie jak karuzela będą dostępne dla większej liczby miejsc, jeśli Google będzie miał więcej dostępnych danych. Obecnie te rezultaty pojawiają się tylko dla największych miast.

Z punktu widzenia SEO nie będzie to miało dużego wpływu w niedalekiej przyszłości. Oba rodzaje danych, strukturyzowane i nieuporządkowane będą wykorzystywane w takich systemach jak Knowledge Vault.


Zapisz się do newslettera wypełniając pola poniżej. Będziesz na bieżąco ze wszystkimi wydarzeniami związanymi z Silesia SEM i informacjami o marketingu internetowym w sieci. Nie spamujemy.

Zostanie wysłany do Ciebie e-mail potwierdzający: przeczytaj zawarte w nim instrukcje, aby potwierdzić subskrypcję.

Twój email:

 Zapoznałem się z polityką prywatności.

The following two tabs change content below.

Artur Strzelecki

Niezależny specjalista SEM, który upowszechnia wiedzę o marketingu w wyszukiwarkach internetowych. W wolnych chwilach doradza dużym i małym klientom.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *