Стенфордська лабораторія бачення та навчання: проведення досліджень у передній частині комп’ютерного зору, машинного навчання та робототехніки

TL; ДОКТОР: Стенфордська лабораторія бачення і навчання (SVL), яку очолювали професори Фей-Фей Лі, Хуан Карлос Ніблзс і Сільвіо Саварезе, є дослідницькою групою, яка працює над подальшими теоретичними рамками та практичним застосуванням комп’ютерного зору. Широка та різноманітна лабораторія, що працює на базі студентів, випускників, науковців-науковців та вчених-відвідувачів, спрямована на вирішення проблем на перетині комп’ютерного зору, машинного навчання та робототехніки. Своїми новаторськими дослідженнями та багатим набором досвідчених випускників, SVL представляє майбутнє штучного інтелекту.

Охарактеризувати професора комп’ютерних наук Стенфорда Фей-Фей Лі як експерта в цій галузі було б заниженням.

Досвідчений дослідник взяв участь у майже 200 високоповажних наукових журналах. Вона обіймала посаду директора лабораторії штучного інтелекту Стенфорда. І вона винайшла ImageNet, візуальний набір даних та зусилля для порівняльного аналізу, призначені для подальшого розвитку глибокого навчання та ІС.

Визнаючи її багато зусиль для просування галузі, Фей-Фей був визнаний одним із великих іммігрантів у 2016 році Фундацією Карнегі, слідуючи Альберту Ейнштейну, Йойо Ма та Сергію Бріну.

У 2017 році під час її відпустки зі Стенфорда її прийняли на роботу на посаду головного вченого AI / ML в Google Cloud. Там вона допомогла розширити бізнес у хмарних обчисленнях компанії за допомогою машинного навчання.

Фей-Фей Лі, Хуан Карлос Нібельс та Сільвіо Саварезе

Група відомих лідерів з інформатики керує лабораторією.

Беручи до уваги досвід та досвід Фей-Фей, легко зрозуміти, чому візіонер ШІ разом із відомими професорами Хуаном Карлосом Нібельсом та Сільвіо Саварезе були готові створити Стенфордську лабораторію бачення та навчання (SVL). Новаторська дослідницька організація працює над подальшими знаннями в області комп’ютерного зору – складного підмножини штучного інтелекту, що передбачає навчання комп’ютерів для реєстрації об’єктів в межах зображень.

“Ми надзвичайно орієнтовані на навчання і зацікавлені в тому, як передові, обчислювальні та важкодоступні ресурси можуть сприяти прогресу в найбільш великих викликах – як це робило Фей-Фей з ImageNet рано”, – сказав Андрій Куренков, кандидат доктора наук Стенфорд та спеціаліст із комунікацій для SVL.

Лабораторія набирає перспективних студентів, таких як Андрій, а також випускників, відвідуючих науковців та професіоналів у всьому світі, щоб допомогти сформувати теоретичні основи та відкрити практичні програми на перетині комп’ютерного зору, машинного навчання та робототехніки. Створюючи постійний потік промисловості та академічний талант, а також новаторські дослідження, SVL працює над тим, щоб формувати майбутнє галузі штучного інтелекту взагалі.

Рішення фундаментальних проблем дослідження комп’ютерного зору

Дослідницька організація розпочалася як дві окремі лабораторії, лабораторія Стенфордського зору та лабораторія обчислювальної зори та геометрії Стенфорда, перед тим як об’єднатися в Станфордську зору та навчальну лабораторію.

“Фей-Фей Лі, Хуан Карлос Нібельс та Сільвіо Саварезе об’єднали свої зусилля для створення однієї великої лабораторії, яка орієнтована на бачення та пов’язані з цим програми”, – сказав Андрій. “Ми проводимо багато досліджень із комп’ютерного зору, але тепер у нас є підгрупи, які зосереджуються на таких речах, як 3D-модальності (які корисні для керування автомобілями, які керують самостійно), робототехніку та охорону здоров’я”.

Андрій сказав нам, що місія SVL багато в чому подібна до більшої науково-дослідної спільноти з штучного інтелекту, хоча і орієнтована на комп’ютерний зір. “Більшість лабораторій нашого типу намагаються розробити та просунути технології, щоб в кінцевому рахунку сприятливо вплинути на світ”, – сказав він.

Образ Джакработа

Stanford Jackrabbot – це самохідна навігаційна візок, здатна перевозити невеликі корисні навантаження.

Наприклад, SVL розробив Jackrabbot – електричну візку з електричною навігацією, розроблену для роботи в просторах, призначених для пішоходів, для заміни або збільшення людських зусиль. Автономний агент був запрограмований для розуміння та передбачення руху людини в громадських приміщеннях, таких як кампус Стенфорда, де технологія тестується.

На фронті охорони здоров’я SVL співпрацює зі Медичною школою Стенфордського університету, щоб дослідити, як комп’ютерний зір та машинне навчання можуть впливати на клінічні результати, покращення здоров’я та базу знань. Завдяки Партнерству в догляді за допомогою ШІ (PAC), дві групи працюють над кількома ініціативами, спрямованими на підтримку інтелектуальної гігієни рук, інтелектуального самопочуття старшого віку, випалення опіку та виявлення активності у відділеннях інтенсивної терапії..

Зрештою, мета полягає у використанні штучного інтелекту для покращення охорони здоров’я, працюючи над усуненням бар’єрів витрат.

Підживлення майбутніх досліджень за допомогою надійних наборів даних

Окрім високо цитованих досліджень та передових розробок, Андрій сказав, що SVL відомий тим, що він надає всебічні набори даних академічній спільноті.

Найвідоміша база даних, лабораторія ImageNet, була фактично створена задовго до утворення SVL, але вона заклала основу для досягнення візуального розпізнавання. Проект організований на основі ієрархії, встановленої в WordNet, базі даних англійської мови, яка має випадки використання в обчислювальній лінгвістиці та обробці природних мов. ImageNet наразі містить лише іменники, але для зображення кожного вузла ієрархії використовуються тисячі зображень.

З проектом асоціюється виклик візуального розпізнавання ImageNet Large Scale (ILSVRC), змагання, в якому учасники ідентифікують об’єкти в межах зображення, щоб їх можна було класифікувати та анотувати. Подія, яка зараз проводиться виключно компанією Kaggle, покликана врешті-решт допомогти комп’ютерам виявити тонкі відмінності у фотографіях, продовжуючи наукові знання щодо виявлення та класифікації об’єктів.

Візуальний геном

Візуальний геном – це ініціатива, що з’єднує структуровані концепції зображення з мовою.

Набори даних, створені після формування SVL, включають візуальний геном, який допомагає з’єднати структуровані концепції зображення з людською мовою. В даний час зусилля складаються з мільйонів описів зображень, об’єктів, атрибутів, відносин та пар-відповідей. Цей тип інформації необхідний комп’ютерам для успішного виконання пізнавальних завдань, що передбачають міркування із зоровим світом.

Інша масштабна база даних, ObjectNet3D, використовується для того, щоб допомогти комп’ютерам розпізнавати 3D-об’єкти в межах 2D-зображень. Ця інформація може прокласти шлях для майбутніх досліджень робототехніки, автономного водіння та доповненої реальності.

Крім того, PAC працює над набором даних про сегментовані та анотовані зображення запису, відомі як BURNED. Він складається з понад 1000 зображень опіків, окреслених пластичними хірургами та маркованими на основі глибини. Дослідники планують використовувати ці дані для побудови автоматизованої зорової системи, здатної передбачати тяжкість опіку та просторовий контур у пацієнтів, покращуючи рішення щодо лікування.

Внески навчальних органів та випускників

З усіх викликів, з якими вирішував SVL, Андрій сказав, що залучення талантів – це не один із них. Фей-Фей Лі, Хуан Карлос Нібельс та Сільвіо Саварезе – всі відомі та шановані професори, які зробили значні наслідки у відповідних галузях навчання, і вони постійно працюють над різноманітним та захоплюючим набором проектів.

“У багатьох випадках студенти приєднуються до лабораторії, переслідуючи ступінь магістра, або навіть як магістр, щоб стати частиною більшого проекту”, – сказав Андрій. “Нові студенти можуть поступово взяти на себе більше роботи і стати важливою частиною дослідження, і це дійсно привабливо”.

Члени лабораторії на відступі

Окрім новаторських досліджень, SVL виробляє постійний потік галузі та академічний талант.

Студенти, які працюють у лабораторії, часто відвідують наукові установи на професійному рівні або захищають ролі у відомих технологічних компаніях. Колишній учасник лабораторії Андрій Карпаті, який зосередився на глибокому навчанні та штучних нейронних мережах під час здобуття доктора в Стенфорді, зараз є старшим директором зі штучного інтелекту Tesla.

Інші видатні випускники – Тімніт Гебру, науковий співробітник з команди Етичного ІС Google; Цзя Лі, який обіймав посаду голови R&D в Інтернеті Google Cloud AI; та Ольга Русаковська, зараз доцент кафедри комп’ютерних наук Принстонського університету.

“Кількість людей, які закінчують лабораторію і стають професорами чи важливими діячами в галузі, досить велика”, – сказав Андрій. “Це означає, що ми годуємо більшу академічну спільноту”.

Після декількох років роботи в теперішньому, комбінованому вигляді, Андрій сказав, що SVL вражає свій крок.

“З нетерпінням чекаємо наших керівників із зацікавленням у тому, чи почнемо ми бачити ще більше переваг у співпраці з тим, що наша лабораторія настільки велика і охоплює так багато різних видів роботи”, – сказав він.

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me