Sieć neuronowa pomoże nam opisać rzeczywistość

Pamiętasz, jak szukałeś zdjęcia z „psem skaczącym wokół drzewa, które rośnie na wzgórzu”? W przyszłości wyszukiwarka nie zgłupieje, gdy wpiszesz do niej taką frazę. Wszystko dzięki sieci neuronowej.

Wspinające się drzewo, fragment drewna. Wielki ptak siedzący na górze. Rower z rowerem, który się o niego opiera – tak wygląda świat oczami aplikacji AI Scry na iOS-a, która wykorzystuje sieci neuronowe do opisywania tego wszystkiego, co zobaczy poprzez szkło aparatu. Choć opisy te nie są zbyt precyzyjne an składne gramatycznie, doskonale przedstawiają potencjał drzemiący w tej technologii przetwarzania obrazu.

Warto zauważyć, że AI Scry nie jest żadnym novum na rynku, bazuje na świetnej sieci neuronowej opracowanej przez Andreja Karpathy’ego, pracownika Uniwersytetu Stanforda. Neural Talk, bo o tej sieci tu mowa, dostępna jest jako projekt open-source, dlatego każdy programista może wykorzystać ją przy projektowaniu własnej aplikacji. AI Scry robi to perfekcyjnie i udowadnia, że w – mniej lub bardziej – dalekiej przyszłości maszyny będą nie tylko widzieć, ale i dogłębnie analizować obrazy, opisując ich najdrobniejsze elementy. Wraz z rozwojem sieci neuronowych i zwiększaniem się mocy obliczeniowej komputerów, rozpoznawanie obrazów nie będzie polegało wyłącznie na wyszukiwaniu kluczowych elementów zdjęcia, możliwe stanie się opisywanie skomplikowanych relacji pomiędzy poszczególnymi przedmiotami.

Ale potencjał drzemiący w sieciach neuronowych jest znacznie większy – wyobraź sobie system inteligentnego domu korzystający z dogłębnej analizy obrazu: lodówka wyśle ci informację o tym, że warzywa zaczynają gnić, a kamera w salonie prześle wiele mówiące powiadomienie „Pies zeżarł ciastko z biurka. Pies zwymiotował ciastkiem na twój świeżo uprany garnitur”. Witamy w przyszłości.

 

PODOBNE POSTY

Odpowiedz