Jak Google wykorzystuje mechanizmy rozpoznawania wzorców

Jak Google wykorzystuje mechanizmy rozpoznawania wzorców do interpretacji zawartości obrazów?

Komputery nie „widzą” zdjęć ani filmów tak samo jak ludzie. Kiedy patrzymy na zdjęcie, widzimy naszą najlepszą przyjaciółkę stojącą przed domem. Z punktu widzenia komputera to samo zdjęcie jest tylko zbiorem danych, które może zinterpretować jako kształty oraz informacje dotyczące wartości poszczególnych kolorów. Mimo że komputer nie reaguje na zdjęcie tak jak człowiek, można go nauczyć rozpoznawać określone wzorce kolorów i kształtów, na przykład typowych form i barw, z których składa się cyfrowy obraz krajobrazu, takiego jak plaża, lub przedmiotu, takiego jak samochód. Ta technologia pozwala Zdjęciom Google porządkować zdjęcia oraz umożliwia użytkownikom ich łatwe wyszukiwanie.

Komputer można też nauczyć rozpoznawania typowych wzorców kształtów i kolorów, z których składa się cyfrowy obraz ludzkiej twarzy. Ten proces nosi nazwę wykrywania twarzy – jest to technologia, która pomaga Google chronić prywatność w usługach takich jak Street View. Za pomocą komputerów wykrywa się i zamazuje twarze ludzi, którzy znaleźli się w pobliżu przejeżdżających samochodów Street View i zostali uwiecznieni na zdjęciach.

Bardziej zaawansowane użycie technologii rozpoznawania wzorców stosowanej do wykrywania twarzy może pomóc komputerowi rozpoznać charakterystyczne cechy wykrywanych twarzy. Na przykład mogą istnieć pewne wzorce sugerujące, że dana osoba jest uśmiechnięta lub ma zamknięte oczy. Tego typu informacje mogą być wykorzystywane w takich funkcjach jak propozycje filmów w Zdjęciach Google czy inne efekty tworzone na podstawie zdjęć i filmów.

Podobna technologia jest też wykorzystywana przez funkcję grupowania według twarzy dostępną w Zdjęciach Google w niektórych krajach. Pozwala ona komputerom wykrywać podobne twarze i je grupować, co ułatwia użytkownikom przeszukiwanie zdjęć i zarządzanie nimi. Więcej informacji o grupowaniu według twarzy można znaleźć w Centrum pomocy Zdjęć Google.

Jak działa wyszukiwanie głosowe?

Wyszukiwanie głosowe umożliwia głosowe podawanie hasła do wyszukania w aplikacji klienckiej wyszukiwarki Google zainstalowanej na urządzeniu zamiast jego wpisywania. Mechanizm wykorzystuje rozpoznawanie wzorców do przekształcania wymawianych słów na tekst pisany. Brzmienie zapytań jest wysyłane do serwerów Google, abyśmy mogli rozpoznać wypowiadane słowa.

W przypadku każdego zapytania głosowego użytego w funkcji wyszukiwania głosowego przechowujemy informacje o języku, w którym zostało ono zadane, i kraju użytkownika, a także naszą interpretację jego znaczenia. Przechowujemy brzmienia zapytań w celu ulepszania naszych usług, w tym uczenia naszego systemu lepszego rozpoznawania prawidłowych zapytań, jeśli uzyskamy zgodę użytkownika na takie wykorzystanie danych. Nie wysyłamy żadnych brzmień do Google, chyba że użytkownik zgłosi zamiar użycia funkcji wyszukiwania głosowego (na przykład naciśnie ikonę mikrofonu na pasku szybkiego wyszukiwania lub klawiaturze wirtualnej bądź powie „Google” w przypadku, gdy pasek szybkiego wyszukiwania zawiera informację o dostępności funkcji wyszukiwania głosowego).