Sapir pozná, co je na obrázku
Identifikování názvu budovy či sochy, před kterou stojíte v cizím městě, by mělo být v budoucnu stejně snadné jako zadání dotazu do vyhledávače Google. Firma IBM společně s několika evropskými institucemi vyvíjí zajímavou službu prohledávání multimediálních dat.
Představte si, že stojíte v Paříži na náměstí a před sebou vidíte skleněnou pyramidovou budovu. Nevíte, jak se stavba jmenuje, a chcete to zjistit. Vyfotografujete jí tedy pomocí mobilního telefonu a v databázi poté spustíte vyhledávání podobných obrazů. V telefonu vám následně vyjedou desítky podobných fotografií téže budovy a vy z údajů přiřazených ke snímkům zjistíte, že se jedná o skleněný vstup do známé galerie Louvre. Tento postup bude možný, budete-li vybaveni vyhledávací službou s názvem Sapir, na níž pracuje firma IBM společně s několika evropskými institucemi.
Oproti současným technikám vyhledávání, které používají tradiční služby jako například Google nebo Yahoo, by mělo jít o výrazný posun kupředu. Název Sapir je zkratka, která znamená Search in Audio-Visual Content Using Peer-to-Peer Information Retrieval, tedy "vyhledávání v audio-vizuálním obsahu prostřednictvím technologie peer-to-peer". V multimediálním obsahu (tedy například ve videu, zvuku nebo obrázcích) Sapir indexuje a analyzuje "nízko-úrovňové deskriptory" nebo atributy, jako jsou barva, uspořádání, tvar nebo zvuk. Technologie pak tyto deskriptory porovnává s dalšími existujícími fotografiemi a dokáže díky nim určit, co přesně je na obrázku. Jedná se tedy o jiný způsob vyhledávání než jaký používají současné klasické vyhledávače. Ty se převážně soustředí na textové značky přiřazené k jednotlivým fotografiím.
Jaké je konkrétní praktické využití nové vyhledávací metody? Společnost IBM plánuje, že uplatnění by mohlo být poměrně široké, a jednu ze zajímavých aplikací by mohla nalézt v oblasti medicíny. Vyhledávač Sapir by mohl asistovat lékařům při určování diagnózy, analyzovat medicínské snímky (například obrazy z počítačové tomografie) a potom je porovnávat se staršími záznamy ze zdravotnických databází.
"Výzkumníci však technologii stále vylepšují a ještě tak nějaký čas potrvá, než dojde k jejímu uvolnění," uvedl k tomu Ari Fishkind, mluvčí společnosti IBM. Sapir je teprve v počátcích, a i na videu je patrné, že zatím nefunguje zcela dokonale. Turista vyfotografuje sochu na jednom z madridských náměstí a pomocí Sapiru si chce vyhledat podobné obrázky. Neshledá však žádnou shodu a do vyhledávání pak přidá ještě klíčové slovo "Madrid". Teprve potom se vyhledávání setká s úspěchem.
Na této službě spolupracuje několik institucí, například izraelská pobočka IBM nebo Institut Maxe Plancka v Německu. Na jeho vývoji se podílí i odborníci z České republiky, konkrétně z Masarykovy univerzity v Brně.
V současnosti je k dispozici internetová stránka o Sapiru, odkud vede odkaz přímo na samotnou službu, kterou si zde můžete vyzkoušet.
Pokusů o vylepšení tradiční techniky vyhledávání, které pracují zejména s vyhledáváním a indexováním klíčových slov, bylo v minulosti již několik. Jedním ze známých experimentů je vyhledávač Wolfram Alpha, který namísto množství nepřeberných dotazů z celého světa sestaví na základě dotazu precizní a obsáhlou odpověď. Jako další příklad "inteligentnějších vyhledávačů" lze uvést projekt Powerset, který by se v budoucnu mohl stát vážným rivalem Googlu. V této službě není kritériem výběru relevantních zdrojů klíčový výraz, ale věta v přirozeném jazyce - jedná se tedy o pokus o to, jak strojové vyhledávání přiblížit přirozenému lidskému vyjadřování.