Платформа Яндекса "Толока", на которой пользователи за деньги выполняют заданные по разметке данных для обучения нейросетей, достанется после раздела Яндекса зарубежному юрлицу и будет работать на иностранных рынках. Для России запустят "Яндекс.Задания".
Рубрика «толока»
«Толоку» в России заменят «Яндекс.Задания» внутри «Яндекс.Крауда»
2023-07-27 в 13:10, admin, рубрики: Раздел Яндекса, Текучка, толока, яндекс, Яндекс.Задания, Яндекс.Крауд, метки: Раздел Яндекса, Текучка, толока, яндекс, Яндекс.Задания, Яндекс.КраудКак пользоваться краудсорсингом? Практический туториал от Яндекса
2019-12-05 в 11:43, admin, рубрики: Блог компании Яндекс, видеокурсы, датасеты, краудсорсинг, машинное обучение, профессии будущего, толока, Учебный процесс в IT, Яндекс.ТолокаМы опубликовали первый русскоязычный туториал по краудсорсингу:
Это серия видео о том, как с помощью передачи простых заданий большому числу исполнителей собрать и разметить данные. Исполнителям можно поручить разные задания: найти что угодно в интернете, оценить дизайн, проверить или создать контент, поучаствовать в опросе, добраться до точки на карте и сфотографировать там что-нибудь. Тысячи людей будут одновременно выполнять перечисленные действия, формируя необходимый набор данных. Выпуск туториала — повод вновь поговорить о том, как краудсорсинг радикально меняет процессы в компаниях.
Читать полностью »
Создаем датасет для распознавания счетчиков на Яндекс.Толоке
2019-10-11 в 11:00, admin, рубрики: big data, computer vision, data collection, data mining, Блог компании Open Data Science, краудсорсинг, машинное обучение, обработка изображений, разметка данных, толока
Как-то два года назад, случайно включив телевизор, я увидел интересный сюжет в программе "Вести". В нём рассказывали о том, что департамент информационных технологий Москвы создает нейросеть, которая будет считывать показания счетчиков воды по фотографиям. В сюжете телеведущий попросил горожан помочь проекту и прислать снимки своих счетчиков на портал mos.ru, чтобы на них обучить нейронную сеть.
Если Вы — департамент Москвы, то выпустить ролик на федеральном канале и попросить людей прислать изображения счетчиков — не очень большая проблема. Но что делать, если Вы — маленький стартап, и сделать рекламу на телеканале не можете? Как получить 50000 изображений счетчиков в таком случае?Читать полностью »
Яндекс открывает датасеты Толоки для исследователей
2019-07-01 в 10:03, admin, рубрики: data mining, Блог компании Яндекс, исследования, Исследования и прогнозы в IT, краудсорсинг, открытые данные, толока, яндексТолока — крупнейший источник размеченных людьми данных для задач машинного обучения. Каждый день в Толоке десятки тысяч исполнителей производят более 5 миллионов оценок. Для любых исследований и экспериментов, связанных с машинным обучением, необходимы большие объёмы качественных данных. Поэтому мы начинаем публиковать открытые датасеты для академических исследований в разных предметных областях.
Сегодня мы поделимся ссылками на первые публичные датасеты и расскажем о том, как они собирались. А ещё подскажем, где же правильно ставить ударение в названии нашей платформы.
Методы распознавания 3D-объектов для беспилотных автомобилей. Доклад Яндекса
2019-01-27 в 8:00, admin, рубрики: 3d-сканирование, birds eye view, self-driving car, Автомобильные гаджеты, беспилотные автомобили, Блог компании Яндекс, лидары, машинное обучение, Работа с 3D-графикой, толокаБеспилотному авто не обойтись без понимания, что находится вокруг и где именно. В декабре прошлого года разработчик Виктор Отлига выступил на «Дата-елке» с докладом о детекции 3D-объектов. Виктор работает в направлении беспилотных автомобилей Яндекса, в группе обработки дорожной ситуации (а также преподаёт в ШАДе). Он объяснил, как мы решаем задачу распознавания других участников дорожного движения в трехмерном облаке точек, чем эта задача отличается от распознавания объектов на изображении и как извлечь пользу из совместного использования разных типов сенсоров.
— Всем привет! Меня зовут Виктор Отлига, я работаю в офисе Яндекса в Минске, занимаюсь разработкой беспилотных автомобилей. Сегодня я расскажу о достаточно важной задаче для беспилотников — распознавании 3D-объектов вокруг нас.
Читать полностью »
Как краудсорсинговая платформа Яндекса помогает компаниям экономить деньги
2018-11-16 в 7:38, admin, рубрики: бизнес-модели, Блог компании Яндекс, краудсорсинг, толока, яндексПродолжаем рассказывать о том, как в Яндексе и других крупных компаниях используют краудсорсинг. В предыдущем посте мы говорили о беспилотниках и качестве поиска товаров.
Сегодня вы узнаете о применении Толоки для обучения Алисы, пополнения Справочника и модерации комментариев. Все подзаголовки кликабельны и ведут на записи докладов. Поехали!
Как краудсорсинговая платформа Яндекса помогает обучать беспилотники и оценивать качество сервисов
2018-10-25 в 10:47, admin, рубрики: Блог компании Яндекс, краудсорсинг, машинное обучение, толока, яндексВ работе часто встречаются долгие и однообразные задачи, для решения которых нужно много людей. Например, расшифровать несколько сотен аудиозаписей, разметить тысячи изображений или отфильтровать комментарии, число которых постоянно растет. Для этих целей можно содержать десятки штатных сотрудников. Но всех их нужно найти, отобрать, мотивировать, контролировать, обеспечить развитие и карьерный рост. А если объем работы сократится, их придется переобучать или увольнять.
Во многих случаях, особенно если не требуется специального обучения, такую работу могут взять на себя исполнители Толоки, краудсорсинговой платформы Яндекса. Эта система легко масштабируется: если заданий от одного заказчика станет меньше, толокеры пойдут к другому, если число задач увеличится, будут только рады.
Под катом – примеры того, как Толока помогает Яндексу и другим компаниям развивать свои продукты. Все заголовки кликабельны – ссылки ведут на записи докладов.
Как создать свой датасет с Киркоровым и Фейсом на Яндекс Толоке
2018-06-07 в 11:00, admin, рубрики: big data, data mining, Блог компании Open Data Science, искусственный интеллект, краудсорсинг, машинное обучение, обработка изображений, толока
Нейронными сетями уже никого не удивишь. Практически каждый человек знает, что такое машинное обучение, линейная регрессия, random forest. Каждый год тысячи людей проходят курсы по машинному обучению на ODS и Coursera. Любой школьник за пару недель теперь может освоить keras и клепать нейроночки. Но в нейронных сетях, как и во всем машинном обучении, помимо создания хорошего алгоритма, необходимы данные, на которых алгоритм будет обучаться.
Лекция о Толоке. Как тысячи людей помогают нам делать Яндекс
2018-05-13 в 12:38, admin, рубрики: amazon mechanical turk, java, postgresql, Блог компании Яндекс, краудсорсинг, Промышленное программирование, толока, Управление сообществом, Яндекс APIЕжедневно десятки тысяч людей выполняют задания в Толоке: оценивают релевантность сайтов, классифицируют изображения, отмечают объекты на фотографиях. Решая эти и многие другие задачи, они помогают нам улучшать существующие и создавать новые алгоритмы, а также поддерживать актуальность данных.
С одной стороны, Толока появилась сравнительно недавно — в 2014 году. С другой, она служит важнейшей частью всех ключевых сервисов Яндекса и десятков сервисов поменьше. Артём Григорьев ortemij объяснил, как эта краудсорсинговая платформа устроена, какие технологии и архитектурные решения применяются при её разработке. Кроме того, Артём рассказал про логику раздачи заданий пользователям, работу с геоданными на карте и управление качеством.
— Пару слов обо мне. Я более семи лет работаю в петербургском офисе Яндекса. Когда я только пришел сюда, я занимался различными инструментами для оценки качества поиска. Мы разрабатывали разные метрики, сравнивали себя с конкурентами и разными версиями других поисковых систем. Сейчас я руковожу службой с длинным названием, как на слайде.
Читать полностью »
Как пользователи учат Яндекс предупреждать о телефонном спаме
2018-04-11 в 8:45, admin, рубрики: catboost, Блог компании Яндекс, информационная безопасность, машинное обучение, определитель номеров, отзывы, приложение яндекс, разработка мобильных приложений, спам, толока, яндексС телефонным спамом знакомы все, кто засветил свой номер в интернете, заполнил сомнительную анкету в офлайне или кому просто не повезло попасть в многочисленные базы. Сегодня мы расскажем читателям Хабрахабра о том, как с помощью отзывов пользователей и машинного обучения мы научили приложение Яндекс предупреждать о нежелательных звонках.
Звонки с незнакомых номеров – это всегда тяжелый выбор. Звонит ли это долгожданный курьер или очередной оператор с «уникальным» рекламным предложением? Для решения этой проблемы существуют мобильные приложения, которые работают на базе справочников известных организаций. Отчасти они решают проблему. Но наиболее агрессивные спамеры, сомнительные коллекторы и злоумышленники в такие базы не попадают. Что делать?