Толока (компания)

Материал из Wikibrand
Толока (компания)
Тип бизнес
Дата основания 2014
Основатели Ольга Мегорская
Отрасль интернет
Материнская компания Nebius Group
Сайт toloka.ai

Toloka (Толо́ка, ранее Яндекс Толока) — нидерландская многонациональная компания, предоставляющая услуги по обработке данных, расположенная в Амстердаме (Нидерланды). Она предоставляет услуги по аннотированию и оценке данных с участием человека, что способствует разработке генеративного искусственного интеллекта и больших языковых моделей. «Толока» — подразделение компании Nebius Group NV, поставщика ИИ-инфраструктуры, акции которой котируются на бирже Nasdaq. В мае 2025 года инвестиционная компания Джеффа Безоса Bezos Expeditions привлекла в компанию раунд финансирования в размере 72 миллионов долларов США. В раунде также принял участие Михаил Парахин, технический директор Shopify.

Клиентами Toloka являются Amazon, Microsoft, Anthropic, Shopify.

Название сервиса

Толо́ка — это форма деревенской взаимопомощи в России, Украине, Белоруссии, Эстонии, Латвии и Литве. Её организовывали в деревне для выполнения срочных работ, требующих большого количества работников: сбор урожая, вырубка леса, сооружение домов и т. д. Иногда толоку использовали для проведения общественных работ (строительство церквей, школ, дорог и т. п.). Идея совместной полезной работы на общий результат сочетается с принципом краудсорсинга.

Толока в составе Yandex N.V. (Яндекс Толока, 2014—2024)

Толока была создана в 2014 году для быстрой разметки большого количества данных, которые затем используются для машинного обучения и совершенствования поисковых алгоритмов. Зачастую, размещаемые задания достаточно простые, для их исполнения не требуется специальная подготовка. В основном они связаны с анализом и оценкой контента. Поэтому любой желающий может выполнять задания и получать за них вознаграждение.

В 2024 году компания Yandex N.V. закрыла сделку по продаже российских активов. Yandex N.V. сохранила контроль над иностранными стартапами Nebius, Toloka, Avride и TripleTen, а также контроль над дата-центром в Финляндии. Yandex N.V. была переименована в Nebius Group.

Виды заданий и область применения результатов

Совершенствование поисковых алгоритмов

Так, в августе 2017-го года Яндекс презентовал новый поисковый алгоритм «Королёв», при создании которого для обучения нейронных сетей использовались оценки толокеров. Результаты разметки помогают улучшить качество поиска и эффективно настраивать алгоритмы распределения его результатов. За два с лишним года существования сервиса они дали около двух миллиардов оценок, которые позволили разработчикам значительно усовершенствовать свой алгоритм.

Развитие машинного обучения

Чтобы машина поняла, как решать ту или иную задачу, необходимо показать ей огромное количество примеров, как положительных, так и отрицательных. Пользователи сервиса Яндекс Толока в числе других задач могут получать и задания по описанию объектов, определённых компьютером на изображении. Например, на фото помечены объекты, которые смог определить искусственный интеллект, но для применения этих данных в деле требуется точно знать, что это за объекты, чтобы обучить искусственный интеллект по массе таких определений человеком. Который, в свою очередь, получит за такую работу вознаграждение. Вдобавок, в Толоке производят проверку автоматически полученных черновиков словарных статей для Яндекс Переводчика.

Аудит и маркетинговые исследования

Проверка качества работы интернет-магазина, службы доставки, написание отзывов о продуктах и услугах. Например, в 2017 году пользователи Толоки принимали участие в проверке качества работы сервиса возврата товара на Яндекс Маркете. Подобные эксперименты позволяют контролировать качество работы сервиса и выявлять слабые места, над которыми позднее будет проведена работа по улучшению и устранению выявленных проблем. В другом проекте пользователям предлагалось написать отзыв на товар из популярных категорий и снабдить его собственными фотографиями.

Выбор дизайна и названий новых продуктов и сервисов

Ответы на вопросы, связанные с выбором наиболее удачного названия и дизайна для нового продукта или сервиса, личными или потребительскими предпочтениями пользователей. В одном из таких опросов толокеры выбирали название для голосового помощника ЯндексаДля опроса взяли как нужные характеристики так и совсем неподходящие, и стали спрашивать: «Если у девушки вот такое имя, то она скорее добрая или агрессивная?».. Целью задания было — определить черты характера девушки с тем или иным именем. С большим отрывом в опросе победило имя «Алиса».

Вознаграждение и вывод средств

Задания в Толоке оплачиваются — сумма, которую можно заработать, указана рядом с заданием. Для вывода средств можно воспользоваться системами: ЮMoney (Бывшие Яндекс Деньги), PayPal, Qiwi. На этапе отладки процессов со стороны Толоки вывод денег может занимать от нескольких минут до месяца.

Мобильные приложения

Для решения задач, которые требуют работу «в поле» (например, пойти по адресу и проверить актуальность информации об организации), существует мобильная версия Толоки. Сервисом разработаны два приложения — для Android и IOS.

Пользователи

Пользователи Толоки, или толокеры — люди, которые за вознаграждение выполняют задания по тестированию и улучшению системы на краудфандинговой площадке Яндекс. Толока. На данный момент в Толоке около 4 миллионов зарегистрированных пользователей из России, с Украины, из Беларуси, Казахстана, Узбекистана, Турции, Франции, Индонезии и других стран, которые выставили более 2 миллиардов оценок. В 2018 году в проектах в «Толоке» поучаствовало больше миллиона людей. Большинство толокеров — это молодые люди до 35 лет (зачастую, студенты технических вузов или мамы в декрете). В основном исполнители рассматривают Толоку в качестве дополнительного источника денег, хотя многие отмечают, что им нравится выполнять полезную работу, делать интернет чище. В 2017 году интернет-холдинг Яндекс наградил 25-летнего челябинца Илью Михаленко за наибольший вклад в совершенствование поисковой системы. На церемонии запуска нового алгоритма поиска челябинцу вручили статуэтку в виде ракеты как символа того, что вводимые работниками Яндекса инновации сопоставимы с полётами людей в космос.

Заказчики

Все задания в Толоке размещают Заказчики. Главные направления использования «Толоки» внутри проектов «Яндекса» — это сбор и обработка данных для проектов, связанных с машинным обучением, речевыми технологиями, компьютерным зрением, умными алгоритмами «Поиска» и т. д., модерация контента (разговоры в «Яндекс Картах»), полевые задания (актуализация данных об организациях в «Справочнике»), оптимизация внутренних бизнес-процессов (поиск публикаций в соцсетях, разметка упоминаний Яндекса по тональности на позитивные и негативные). Поскольку над задачей одновременно работают как минимум сотни, а то и тысячи толокеров, результаты готовы в худшем случае на следующий день.

Исследования в Толоке

Толока — это не только инструмент для решения прикладных задач, но и площадка для научных исследований в разных предметных областях. В мае 2019 года команда сервиса начала публиковать наборы данных для некоммерческих, академических целей, чтобы поддержать научное сообщество и привлечь исследователей в Толоку. Датасеты могут быть интересны исследователям разных направлений: для лингвистических исследований, для задач компьютерного зрения, для тестирования моделей агрегации вердиктов исполнителей и обучения чат-ботов.

См. также

Микрозанятость

Критика

Для выявления и изъятия ЛГБТ-книг интернет-издательство Ridero использовало нейросеть, обучавшуюся с помощью «Толоки», пользователям которой предлагали прочитать текст и указать, одобряется ли в нём «существование лесбиянок, геев, бисексуалов и трансгендеров», смена пола, зоофилия, некрофилия, идеи чайлдфри или инцест. В пресс-службе «Яндекса» сообщили, что отозвали это задание, сочтя его оскорбительным. Согласно данным взлома белорусскими хакерами Главного радиочастотного центра Роскомнадзора в ноябре 2022 г., «Яндекс. Толока» активно используется Роскомнадзором для обучения нейросетей ищущего «запрещённый контент» «Чистого интернета».

Примечания

Ссылки