Jesteś tym, czego szukasz

cup of coffee

4 sierpnia 2006 r. zespół badawczy America OnLine, prowadzony przez Abdura Chowdhury, opublikował skompresowany plik tekstowy na jednej ze swoich stron, który zawierał 20 milionów słów kluczowych od ponad 650 tysięcy użytkowników zbierany na przestrzeni 3 miesięcy. Dane były zbierane do celów badawczych. AOL zamknął publiczny dostęp do pliku po trzech dniach, ale stało się to zanim został on skopiowany w inne miejsca Internetu.

Chociaż żaden z rekordów znajdujących się w pliku nie identyfikuje jawnie żadnego użytkownika, to jednak pewne słowa kluczowe zawierają informacje osobiste, które wprowadził do wyszukiwarki sam użytkownik, np.

  • szukając informacji o samym sobie,
  • o swoim adresie,
  • numerze ubezpieczenia społecznego
  • lub innych informacji osobistych.

Ponieważ każdy użytkownik na tej liście identyfikowany jest przez unikalny klucz, możliwa jest do odtworzenia historia wyszukiwania dla danego użytkownika. New York Times był w stanie odnaleźć indywidualne osoby z tego publicznego i anonimowego źródła na podstawie numerów telefonicznych abonentów.


Definicje

Odwołując się do terminów, konsekwentnie należy rozumieć pod nimi następujące definicje:

  • Kwerenda: Łańcuch wprowadzony przez użytkownika do wyszukiwarki jako prośba o informację.
  • Term: Pojedyncze słowo w kwerendzie, oddzielone białym znakiem. Termy mogą zawierać znaki alfanumeryczne, punktory lub inne symbole. Liczba termów w kwerendzie to długość kwerendy. Wyrażenia wielowyrazowe zawarte w cudzysłowie również traktowane są jako kilka termów.
  • Sesja: Zbiór kwerend od jednego, konkretnego użytkownika uznanych (zwykle heurystycznie) za część pojedynczej interakcji z wyszukiwarką. Sesja może zawierać kwerendy, które dotyczą więcej niż jednej potrzeby informacyjnej.
  • Strona z wynikami: Uporządkowana lista rezultatów przedstawiona użytkownikowi w odpowiedzi na kwerendę. Strona z wynikami zwykle zawiera odnośniki do 10 rezultatów oraz zmienna liczbę odnośników sponsorowanych lub innego rodzaju.
  • Rezultat: Indywidualny adres URL na stronie z wynikami wraz z reprezentatywnym urywkiem tekstu wydobyty ze strony, zapewniający dostęp do dokumentu zasugerowanego przez wyszukiwarkę jako odpowiedź na kwerendę.
  • Kliknięcie: Akcja użytkownika polegająca na kliknięciu w rezultat wyświetlony na stronie z wynikami, aby przejść do strony pod wskazanym adresem URL.

Bazując na tych definicjach zauważamy, że sesja zawiera jedną lub więcej kwerend, każda z nich składa się z jednego lub więcej termów. Każde wprowadzenie kwerendy powoduje powstanie strony z wynikami i jako rezultat przeglądania tej strony, użytkownik może wygenerować zero, jedno lub wiele kliknięć.

Każdy rekord reprezentuje jedną z dwóch możliwych akcji:

  1. Kwerenda za wynikami której użytkownik nie podążył i nie kliknął żadnego z rezultatów.
  2. Kwerenda za wynikami której użytkownik podążył i kliknął jeden lub więcej rezultatów.

Kwerendy

Wolumen kwerend otrzymywanych przez wyszukiwarkę podąża za następującym wzorem, w tygodniu osiąga szczyt, natomiast w weekend silnie opada. Odzwierciedla to tygodniowy cykl pracy przeciętnego użytkownika, a nawet oddaje trend, zgodnie z którym, liczba wprowadzanych kwerend zmniejsza się wraz upływem czasu każdego tygodnia. Możliwe, że to wynik zmniejszania się indywidualnej produktywności. Sugeruje to także, iż zarówno wyszukiwanie w sieci stało się ważną i integralną częścią pracy w każdym standardowym biurze oraz że pracownicy wykorzystują zasoby pracodawcy (czas i łącze) do podejmowania swoich prywatnych poszukiwań w sieci.

Codzienne korzystanie z wyszukiwarki

Szczegółowość skali godzinowego rozkładu wysyłania kwerend do wyszukiwarki jest na poziomie jednej sekundy a rozkład jednego dnia przedstawia uśrednione wartości dla całego okresu 92 dni w ciągu 3 miesięcy. Dokładna analiza danych ujawnia schemat przesyłania kwerend zgodnie z którym, aktywność korzystania z wyszukiwarki rozpoczyna się od wczesnego ranka, około godziny 4 rano czasu PST, w tym czasie w Nowym Jorku jest godzina 7 rano, osiąga swój szczyt około godziny 12 PST, gdy cały „kraj” jest w pracy, a następnie równomiernie opada aż do północy PST.

Godzinowy rozkład korzystania z wyszukiwarki

Jedną z największych fascynacji przy analizie kwerend jest możliwość poznania, czego szukają użytkownicy. Pierwszą obserwację jaką można dokonać na podstawie tej próbki danych jest, iż kiedy pojawi się przed użytkownikiem okno dialogowe, często jest wykorzystywanie do kwerend nawigacyjnych. Dziesięć najpopularniejszych kwerend wydobytych z danych Google, to były zapytania o inne popularne witryny internetowe, również o inne wyszukiwarki internetowe. Wiele z nich składa się z pełnego adresu URL. Co ciekawe, AOL korzysta z silnika Google, jednak najczęściej klikanym przez użytkownika odnośnikiem było właśnie adres http://www.google.com. Najwyraźniej użytkownicy traktują wyszukiwarkę jako nawigacyjny interfejs użytkownika i wpisują do niej prosto znane sobie adresy.

Wpływ na SEO

Powszechnie wiadomo, iż najważniejsze i najczęściej odwiedzane są rezultaty na trzech pierwszych pozycjach w na stronie z rezultatami, te dane potwierdzają tę tezę. Analiza liczby klikniętych rezultatów pokazuje, iż rezultat na pozycji #1 zebrał 42,3% wszystkich zarejestrowanych kliknięć. Rezultat na pozycji #2 naliczył tylko 11,92% całkowitej liczby kliknięć – prawie 75% mniej kliknięć niż pierwszy rezultat. Z punktu widzenie widoczności w wynikach wyszukiwania, oznacza to, że rezultat na #1 pozycji zbiera czterokrotnie więcej wizyt użytkowników niż jego najbliższy rywal.

Klikalność kolejnych pozycji

Rezultat na pozycji #3 osiąga 8,44% wszystkich kliknięć, prawie 30% mniej niż na pozycji #2 i ponad 80% mniej niż na pozycji #1. Przesuwając się w dół rezultatów na stronie z wynikami, każdy kolejny rezultat notuje mniejszą popularność od poprzedniego. Jednak należy zauważyć, iż rezultat na pozycji #10 zebrał niewiele więcej kliknięć niż rezultat #9. Najprawdopodobniej wynika to z reakcji użytkownika po przewinięciu strony z wynikami w dół, gdzie bardziej zauważa ostatni rezultat, zamiast przedostatni. Analizując drugą stronę z wynikami, należy zauważyć iż aktywność użytkowników dramatycznie spadła. Rezultat #11 wyniósł jedynie 0,66% ogólnej liczby kliknięć. Następujący wniosek z tego wynika, iż najbardziej liczy się obecność na pierwszej stronie z wynikami, pozostałe rezultaty są zauważane przez mniej niż 1% użytkowników.

Na podstawie analizy ścieżek wyszukiwania, czyli kolejnych przesyłanych kwerend oraz ich treści można wytypować 6 grup użytkowników korzystających z wyszukiwarki:

  • Oglądający pornografie – w bazie znajdują się miliony kwerend z zapytaniem o treści pornograficzne. Oglądających można nie tylko podzielić ze względu na to co szukają lecz także kiedy szukają. Niektórzy użytkownicy szukają pornografii przez cały dzień, inni tylko w sprecyzowanych przedziałach czasowych, które najczęściej rozpoczynają się około godziny 11 wieczorem.
  • Poszukujący innych osób – jedne osoby szukają innych osób. Większość danych pokazała, że szuka się osoby tylko raz, bez względu na porę i dzień, a następnie już się do niej nie wraca. Być może sprawdza się kandydatów do pracy lub szuka starych znajomych.
  • Kupujący – okazuję się, że kupujący najczęściej szukali okazji lub rabatów.
  • Obsesyjni – to osoby, które stale szukają tego samego.
  • Bezcelowi – wielu użytkowników nie ma obsesji na punkcie tego co szuka, po prostu stale używają wyszukiwarki i szukają nowych informacji, np. ciekawostek o filmach.
  • Nowi – ci użytkownicy dopiero dowiedzieli się jak włączyć komputer. Ci najczściej wpisują w okno kwerendy adres url poszukiwanej strony lub np. nie używają spacji.

Niektóre dane są niepokojące. Istnieje wiele rekordów, zawierających kwerendy użytkowników, którzy szukają informacji jak popełnić samobójstwo lub bardziej przerażające kwerendy, od osób które chcę popełnić zabójstwo.

Wnioski:

  • Szukamy wszystkiego i o wszystkim
  • Dobrze, że nikt nie wie czego szukamy
The following two tabs change content below.

Artur Strzelecki

Niezależny specjalista SEM, który upowszechnia wiedzę o marketingu w wyszukiwarkach internetowych. W wolnych chwilach doradza dużym i małym klientom.

6 przemyśleń nt. „Jesteś tym, czego szukasz

  1. Witam,

    Czy mogę się ładnie uśmiechnąć Artur do Ciebie o te kwerendy, na warsztatach mówiłeś że można je znaleźć w …. 🙂 (obecni na warsztatach wiedzą gdzie )

  2. Ciekawa zabawa danymi Artur!
    Mam dla Ciebie propozycję/do Ciebie prośbę: na 15 slajdzie pokazujesz rozkład klikalności poszczególnych pozycji w SERP. Z kolei chyba slajd wcześniej pokazujesz klikalność poszczególnych adresów. Czy mógłbyś przygotować slajd pokazujący rozkład klikalności poszczególnych pozycji w SERP, ale bez uwględnienia akcji: kwerenda=myspace -> kliknięcie w (prawdopodobnie pierwszy link) http://www.myspace.com. Chodzi mi o to, że wyszukania po nazwach witryny nie dają moim zdaniem właściwego obrazu rozkładu klikalności, ponieważ są zafałszowane wyszukaniami j/w.

    Co do slajdu 16 mam taką refleksję: faktycznie CTR może być gorszy, ale moim zdaniem dlatego, że wyniki generowane przez wyszukiwarkę są gorsze. Często mam sytuację, w której im bardziej skomplikowane/rozbudowane zapytanie otrzymuję gorsze wyniki i po prostu nie ma w co kliknąć. Wydaje mi się, że przy bardziej rozbudowanych zapytaniach jest większe pole do popisu dla systemu reklamy Google AdWords, w którym można zaobserwować znacznie wyższy CTR dla dłuższych zapytań.

  3. Tomek, żałuję, że dzień miałem bardzo zabiegany i nie pogadaliśmy chwilę. Odrobimy następnym razem. Rozumiem, w tabeli masz najczęściej klikane adresy, ale to nie są najczęściej wpisywane kwerendy. Takiego slajdu faktycznie nie było. Przy czym, byłyby one bardzo podobne, bo dopiero 11 najczęściej wpisywana kwerenda to nie adres url!

  4. Katowice są wszędzie po drodze, więc na pewno nadrobimy 🙂
    Tylko mi właśnie chodzi o odrzucenie wszystkich zapytać „oczywistych” i wynikających z nich klików. Wg mnie ciekawe spojrzenie mogłaby rzucić na temat analiza bardziej urealnionych zapytań.
    Przykład: kwerenda http://www.wp.pl, wp.pl, wp -> do odrzucenia, ale kwerenda ‚portal’ już jak najbardziej do analizy.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *