Рубрика «ШАД» - 2

Машинное обучение — микроскоп современного ученого. Зачем ЦЕРНу технологии Яндекса

2014-07-20 в 11:16, admin, рубрики: CERN, Блог компании Яндекс, Облачные вычисления, физика, физика высоких энергий, ЦЕРН, ШАД, школа анализа данных

В начале июля в нашем офисе прошел семинар, посвященный взаимодействию Яндекса и ЦЕРН. В понедельник мы опубликовали первую его часть — доклад Андрея Голутвина о новом эксперименте SHiP (Search for Hidden Particles). Вторая часть этого семинара была отведена Андрея Устюжанина о совместных проектах Яндекса и ЦЕРН.

Андрей рассказал о применении технологий Яндекса в физике высоких энергий. В наши дни над экспериментами зачастую работает огроное количество людей из разных стран. Объединенная экосистема для автоматизации экспериментов может сделать работу исследователей более скоординированной и поможет решить множество других проблем. Единый интерфейс, онлайн-доступ к результатам других участников, система версионирования и возможность обмена библиотеками — все это может сильно упростить исследователям жизнь.

Кроме того, в современной физике высоких энергий активно применяется машинное обучение. На основе тестовых выборок обучаются классификаторы, которые в дальнейшем определяют наличие тех или иных событий уже в реальных данных. При этом количество формул, которые может потребоваться обучить для одного анализа, достигает нескольких сотен или даже тысяч. Надо, однако, иметь в виду, что наши разработки применимы не только в этой сфере, но и в других отраслях науки. Этот доклад — скорее про исследования в целом, про процесс экспериментального подтверждения различных теорий, гипотез и моделей. С такими задачами обычно сталкиваются люди из научно-исследовательских организаций, но сейчас все чаще они возникают и в коммерческих компаниях.
Читать полностью »

Заочное обучение в ШАД Яндекса: 570 замечательных часов моей жизни

2014-05-28 в 15:35, admin, рубрики: Учебный процесс в IT, ШАД, метки: шад

Заочное обучение в ШАД Яндекса: 570 замечательных часов моей жизни Два года назад на меня сильное впечатление произвела хабрастатья «Стивен Вольфрам проанализировал свою жизнь». К тому времени я уже года два записывал в Google-календаре, что и когда я делал, но к тому моменту я не задумывался, о том, что можно сделать с этой информацией. После прочтения той статьи, я понял: эту информацию можно анализировать! Сейчас я могу посчитать сколько раз мы с друзьями собирались играть в баскетбол за эти годы, сколько часов я провёл в больнице и т. п.

На этой неделе я сделал последнюю домашнюю работу в ШАД и решил посчитать сколько времени у меня ушло на обучение, сколько я в среднем тратил в неделю, сколько строчек кода я написал и т. д. Построил несколько графиков и гистограмм, показал их друзьям и понял, что, возможно, такая информация будет интересна кому-либо ещё. Так что если вы хотите узнать сколько страниц отчётов было написано, насколько верна оценка нагрузки в ШАД в 15–20 часов в неделю, а также моё субъективное мнение о курсах в ШАД, то добро пожаловать под хабракат.

Читать полностью »

Алгоритмы о выборе дороги и сетях. Сети Штейнера. Лекция Владимира Протасова в Яндексе

2014-03-18 в 12:02, admin, рубрики: Алгоритмы, Блог компании Яндекс, геометрия, Сетевые технологии, сети, ШАД, школа анализа данных, метки: геометрия, сети, шад, школа анализа данных

Сегодня мы поговорим об одной из первых задач теории больших сетей, которая может быть решена полностью на самом простом базовом уровне, но которая от этого не становится менее интересной. Это задача о кратчайшей системе дорог или задача Штейнера.

Впервые она появилась, когда еще никаких практических надобностей для больших сетей не было: в тридцатые годы XX века. На самом деле Штейнер начал ее изучать еще раньше, в XIX веке. Это была чисто геометрическая задача, практические приложения которой стали известны только несколько десятилетий спустя.

Разговор пойдет о той области математики, которая впоследствии выросла в теорию больших сетей и разбилась на несколько областей. Это прикладная отрасль, которая задействует очень много методов из других математических дисциплин: дискретной математики, теории графов, функционального анализа, теории чисел и т.д. Бурное развитие теории больших сетей пришлось на конец девяностых и начало двухтысячных годов. Связано это конечно, с прикладными задачами: развитием интернета, мобильной связи, транспортных задач для больших городов. Кроме того теория сетей используется в биологии (нейронные сети), при построении больших электронных плат и т.п.

Сама задача формулируется очень просто. Есть несколько точек на плоскости, которые нужно связать системой дорог наименьшей суммарной длины таким образом, чтобы по этим дорогам можно было из каждой точки добраться в любую другую. Число точек конечно.

Начать рассказ стоит с истории о том, как на Малом мехмате двум группам учеников – восьмиклассникам и одиннадцатиклассникам дали решать одну и ту же задачу. Четыре деревни расположены в вершинах квадрата со стороной четыре километра. Существует ли система дорог, которая связывала бы все эти деревни между собой и имела бы суммарную длину не превосходящую 11 километров.
Читать полностью »

Знания о языке и Яндекс. Зачем нам падежи? Лекция малой школы анализа данных

2013-12-21 в 10:55, admin, рубрики: Блог компании Яндекс, лингвистика, Малый ШАД, Поисковые машины и технологии, Учебный процесс в IT, ШАД, метки: лингвистика, Малый ШАД, шад

По разным оценкам сейчас в мире существует от трех до семи тысяч языков. Между языками могут быть очень значительные различия в графематике, фонетике, грамматике, лексике. Но если посмотреть шире, станет ясно, что все языки очень похожи и подвержены описанию при помощи универсальных категорий.

В этой лекции Елена Грунтова раскрывает студентам Малого ШАДа понятие грамматической категории и подробно рассказывает падежах, их природе, типах, а также способах выражения.

Лекция рассчитана на старшеклассников, но выходит за рамки школьной программы, поэтому может быть интересна и взрослым.
Читать полностью »

Машинное обучение и анализ данных. Лекция для Малого ШАДа Яндекса

2013-12-14 в 12:29, admin, рубрики: Алгоритмы, Блог компании Яндекс, Малый ШАД, машинное обучение, Учебный процесс в IT, ШАД, метки: Малый ШАД, машинное обучение, шад

Все чаще и чаще мы сталкиваемся с необходимостью выявлять внутренние закономерности больших объёмов данных. Например, для распознавания спама необходимо уметь находить закономерности в содержании электронных писем, а для прогнозирования стоимости акций — закономерности в финансовых данных. К сожалению, выявить их «вручную» часто невозможно, и тогда на помощь приходят методы машинного обучения. Они позволяют строить алгоритмы, которые помогают находить новые, ещё не описанные закономерности. Мы поговорим о том, что такое машинное обучение, где его стоит применять и какие сложности могут при этом возникнуть. Принципы работы нескольких популярных методов машинного обучения будут рассмотрены на реальных примерах.

Лекция предназначена для старшеклассников — студентов Малого ШАДа, но и взрослые с ее помощью смогут составить представление об основах машинного обучения.

Основная идея машинного обучения заключается в том, что имея обучающуюся программу и примеры данных с закономерностями, мы можем построить некоторую модель закономерности и находить закономерности в новых данных.
Читать полностью »

Архитектура Поиска Яндекса. Лекция для Малого ШАДа

2013-11-30 в 19:32, admin, рубрики: Блог компании Яндекс, лекции, Малый ШАД, поиск, Поисковые машины и технологии, ШАД, яндекс, метки: лекции, Малый ШАД, поиск, шад

В этой лекции на примере Яндекса будут рассмотрены базовые компоненты, необходимые для организации интернет-поисковика. Мы поговорим о том, как эти компоненты взаимодействуют и какими особенностями обладают. Вы узнаете также, что такое ранжирование документов и как измеряется качество поиска.

Лекция рассчитана на старшеклассников – студентов Малого ШАДа, но и взрослые могут узнать из нее много нового об устройстве поисковых машин.

Первый компонент нашей поисковой машины – это Паук. Он ходит по интернету и пытается выкачать как можно больше информации. Робот обрабатывает документы таким образом, чтобы по ним было проще искать. По простым html-файлам искать не очень удобно. Они очень большие, там много лишнего. Робот отсекает все лишнее и делает так, чтобы по документам было удобно искать. Ну и непосредственно поиск, который получает запросы и выдает ответы.
Читать полностью »

Компьютерное зрение. Лекция для Малого ШАДа Яндекса

2013-11-21 в 15:03, admin, рубрики: Блог компании Яндекс, дополненная реальность, Компьютерное зрение, лекции, Малый ШАД, обработка изображений, ШАД, метки: Компьютерное зрение, лекции, Малый ШАД, шад

Область применения компьютерного зрения очень широка: от считывателей штрихкодов в супермаркетах до дополненной реальности. Из этой лекции вы узнаете, где используется и как работает компьютерное зрение, как выглядят изображения в цифрах, какие задачи в этой области решаются относительно легко, какие трудно, и почему.

Лекция рассчитана на старшеклассников – студентов Малого ШАДа, но и взрослые смогут почерпнуть из нее много полезного.

Возможность видеть и распознавать объекты – естественная и привычная возможность для человека. Однако для компьютера пока что – это чрезвычайно сложная задача. Сейчас предпринимаются попытки научить компьютер хотя бы толике того, что человек использует каждый день, даже не замечая того.

Наверное, чаще всего обычный человек встречается с компьютерным зрением на кассе в супермаркете. Конечно, речь идет о считывании штрихкодов. Они были разработаны специально именно таким образом, чтобы максимально упростить компьютеру процесс считывания. Но есть и более сложные задачи: считывание номеров автомобилей, анализ медицинских снимков, дефектоскопия на производстве, распознавание лиц и т.д. Активно развивается применение компьютерного зрения для создания систем дополненной реальности.

Читать полностью »

Открылся новый набор в Школу анализа данных Яндекса

2013-04-30 в 9:17, admin, рубрики: computer science, анализ данных, Блог компании Яндекс, Учебный процесс в IT, ШАД, школа анализа данных, яндекс, метки: computer science, анализ данных, шад, школа анализа данных, яндекс

Открылся новый набор в Школу анализа данных Яндекса На днях мы открыли новый набор в Школу анализа данных. Чтобы стать её студентом, нужно ответить на вопросы в тесте, сдать экзамены и пройти собеседование. Занятия, как всегда, будут проходить в офисе Яндекса в Москве, а также в Екатеринбурге, Киеве и Минске. В Питере у ШАД есть отделение в Computer Science Center. Если вы живёте в других городах, то можете учиться у нас заочно: общаться с преподавателями по электронной почте и смотреть видеолекции. Обучение в Школе бесплатное.

В ШАД преподают ведущие российские ученые — и те, кто живет в России, и те, кто работает за рубежом. Например, теорию машинного обучения ведёт Алексей Червоненкис, профессор Лондонского университета и один из создателей отечественной школы анализа данных. Автор курса по анализу данных и научный руководитель ШАД — профессор Rutgers University Илья Мучник, который когда-то был научным руководителем Аркадия Воложа.
Читать полностью »

Пять лет Школе анализа данных

2012-07-25 в 9:29, admin, рубрики: Блог компании Яндекс, ШАД, школа анализа данных, яндекс

Ровно пять лет назад Яндекс объявил об открытии Школы анализа данных (ШАД). Для нас это был серьезный, хотя и рискованный шаг. Сегодня можно смело сказать, что всё получилось. Нам удалось создать сильную магистерскую программу, которая ценится в профессиональном сообществе. Сейчас конкурс в ШАД составляет пять-шесть человек на место, как в престижном вузе. В день рождения Школы мы хотим вспомнить о том, как все начиналось.

В середине 2000-х стало понятно, что на рынке почти нет специалистов, которые нам нужны. Многие представители советской школы анализа данных, которая была сильна в 60-70 годы, уехали из страны. Даже ВМиК или мехмат МГУ не давали достаточных знаний для решения задач, связанных с обработкой данных (текстов, изображений, музыки, голоса). Необходимо было возрождать научную среду и выращивать новое поколение программистов. А талантливые ребята в России были всегда, сколько бы отсюда ни уезжали.

Поначалу мы верили, что рядом с нами кипит жизнь, что где-то есть студенты и аспиранты, которые занимаются анализом данных — их нужно только поискать. Мы провели несколько конкурсов по анализу интернет-данных, но среди их участников студентов и аспирантов почти не было. Тогда мы попробовали договориться с вузами о создании курсов, которые готовили бы специалистов для Яндекса. Однако вузы предлагали свои программы и не были готовы разрабатывать новые. Так постепенно мы пришли к мысли, что нужно создавать свою школу. Огромную роль в ее создании сыграли Илья Мучник, Григорий Кондаков, Елена Бунина, Максим Бабенко.

Читать полностью »

Стартует новый набор в Школу анализа данных Яндекса

2012-04-10 в 14:09, admin, рубрики: Блог компании Яндекс, ШАД, яндекс

Сегодня, 10 апреля, стартовал очередной, уже шестой, набор в Школу анализа данных Яндекса. В этом году и сроки, и правила поступления в Школу немного поменялись, и обо всех изменениях мы хотим рассказать подробнее.

1. Отделения «Анализ данных» и «Computer science» в Москве
В предыдущие годы поступление на эти отделения было двухэтапным: заочное онлайн-тестирование и очное собеседование с преподавателями Школы.

Изначально заочный тест был несложным – так, в прошлом году тест не прошло всего 15% кандидатов и к собеседованию было допущено более 600 человек! Понятно, что администрации Школы все тяжелее уделить каждому кандидату несколько часов.

В этом году для допуска к собеседованию необходимо хорошо решить задачи очного письменного экзамена. И тестирование, и экзамен, и собеседование проводятся в рамках нашей программы по математике и программированию.

Заполнить анкету и пройти онлайн-тест все желающие могут уже сейчас у нас на сайте, заочный этап будет проходить до 20 мая включительно.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «ШАД» - 2

Машинное обучение — микроскоп современного ученого. Зачем ЦЕРНу технологии Яндекса

Заочное обучение в ШАД Яндекса: 570 замечательных часов моей жизни

Алгоритмы о выборе дороги и сетях. Сети Штейнера. Лекция Владимира Протасова в Яндексе

Знания о языке и Яндекс. Зачем нам падежи? Лекция малой школы анализа данных

Машинное обучение и анализ данных. Лекция для Малого ШАДа Яндекса

Архитектура Поиска Яндекса. Лекция для Малого ШАДа

Компьютерное зрение. Лекция для Малого ШАДа Яндекса

Открылся новый набор в Школу анализа данных Яндекса

Пять лет Школе анализа данных

Стартует новый набор в Школу анализа данных Яндекса