Метка «яндекс» - 120

Яндекс продолжает развивать свои API-функции. И вот результат в виде нового парсера. Томита-парсер – это инструмент для извлечения структурированных данных (фактов) из текста на естественном языке. Извлечение фактов происходит при помощи контекстно-свободных грамматик и словарей ключевых слов. Парсер позволяет написать свою грамматику, добавить свои словари и запустить на текстах.

Томита-парсер позволяет по написанным пользователем шаблонам (КС-грамматикам) выделять из текста разбитые на поля цепочки слов или факты. Например, можно написать шаблоны для выделения адресов. Здесь фактом является адрес, а его полями — «название города», «название улицы», «номер дома» и т.д. Парсер включает в себя три стандартных лингвистических процессора: токенизатор (разбиение на слова), сегментатор (разбиение на предложения) и морфологический анализатор (mystem). Основные компоненты парсера: газеттир, набор КС-грамматик и множество описаний типов фактов, которые порождаются этими грамматиками в результате процедуры интерпретации.
Читать полностью »

В феврале в Санкт-Петербурге прошла вторая конференция для менеджеров проектов и руководителей групп – «План Б».

Менеджеры Яндекса и других крупных компаний поделились своим опытом, рассказали про ошибки и провалы, объяснили, почему они случаются, и посоветовали, что делать, чтобы они не повторялись.

events.yandex.ru/events/planb/spb-feb-2013/talks/ — тут выложены видео всех докладов.

Наиболее интересными мне показались Неурядицы при создании сложных проектов/сервисов, Ошибки в стартапах, Читать полностью »

Друзья, мне тут в руки попал рассказ Саши Куприна про его поездку на финал, знакомство с Яндексом, диплом и ночевки в офисе. С разрешения автора делюсь с вами!

Яндекс достаточно давно интересуется олимпиадными программистами. Будучи второкурсником, я слушал рассказы про ШАД Григория Кондакова, выступления Миши Левина. Получал футболки и брошюры на четвертьфиналах и полуфиналах чемпионата мира. Но, знаете, в то далёкое исключительно олимпиадное время совсем не волновали вопросы работы, а уж тем более дополнительного обучения. Ну, до поры, до времени.

На четвёртом курсе наша провинциальная команда (Orel STU) пробилась на финал ACM ICPC. Это был, мягко говоря, феерический успех – ведь мы никогда не срывали звёзд с неба, да и отбор был посерьёзнее, чем нынче. К нашей неугомонной радости случилась революция в Египте, которая стала причиной переноса финала из Шарм-Эль-Шейха в город Орландо солнечных штатов Америки.

А там-то и случился тот короткий разговор. Как-то вечером в chill zone мы болтали с Мишей Левиным о танцевальном агрегате, как вдруг подошёл на тот момент мне неизвестный Серёжа Чернышёв и, опознав по футболке участника финала, спросил: «В Яндекс к нам хочешь?» А чего отказываться? =)

Всё получилось как-то удивительно просто. Перекинулись парой писем. Уладили какую-то бюрократию — анкетку заполнить, даты согласовать. У меня оказался один формальный начальник и сразу несколько реальных.
Читать полностью »

Бытует мнение, что русская морфология у Яндекса реализована лучше чем у Google. В этой статье я покажу, что дело обстоит ровным счетом наоборот.
image
Читать полностью »

Пока компьютер не начнет думать как человек, он не сможет отличить плохой сайт от хорошего… так, как это сделал бы человек. На самом деле поисковые системы имеют в своих арсеналах методики сбора и анализа данных, с помощью которых кремниевые мозги легко затыкают за пояс знатоков из мяса.

Сразу оговоримся — под «хорошим» сайтом мы имеем в виду «достойный занять место в поисковой выдаче по конкретному ключевому запросу», не будем погружаться в дебри эстетики сайтостроения.

Итак, если не вдаваться в детали, сейчас в поисковых системах комплексно применяется три подхода: ранжирование страниц по авторитетности (пример — принесший Google популярность алгоритм PageRank), поведенческие факторы (анализ действий реальных посетителей реальных сайтов) и машинное обучение (пример — «Матрикснет» Яндекса, который обучает алгоритмы оценками выборок специалистами-асессорами, ну и по сути увязывает и уравновешивает первые два подхода).

Ранжирование по авторитетности на ранних этапах развития интернета работало очень хорошо, но в дальнейшем «слишком математическая» природа такого подхода позволила оптимизаторам применять фокусы, использующие найденные в ходе экспериментов слабости системы. Качество выдачи страдало, поисковики вводили поправки, дополнительные формулы и коэффициенты, фильтры и санкции, но по-настоящему крупный прорыв был сделан, когда появилась возможность ранжировать сайты на основе предпочтений их реальных живых посетителей. Анализ поведенческих факторов объективнее любых личных пристрастий (как экспертных, так и профанных), поскольку работает с предпочтениями большой выборки целевой аудитории.
Читать полностью »

image

Компания Yandex любит выделиться. Она уже сделала Yandex Chrome Браузер. Настало время сделать Yandex Play Store, альтернативный магазин приложений для Android-устройств.Читать полностью »

Этой весной в Москве пройдёт ECIR — одна из самых значимых в мире научных конференций по информационному поиску. Её организаторами выступают Яндекс и Высшая школа экономики. Этот ECIR будет уже 35-м по счёту, но в России конференция пройдёт впервые.

ECIR 2013

С 24 по 27 марта о своих исследованиях расскажут учёные из Беркли, Лондонского университета королевы Марии, Университета китайской Академии Наук, Школы компьютерных наук Университета Глазго и других ведущих научных школ Европы, США, Южной Америки и Азии. В нашем офисе и в Digital October проведут воркшопы и прочитают доклады исследователи из таких компаний и индустриальных лабораторий, как Twitter, Yahoo! Labs, Microsoft Research, Ebay, IBM Research.
Читать полностью »

Сегодня, 25 февраля 2013 года, Яндекс запустил в работу свой магазин приложений Яндекс.Store.
Главное его отличие, в том, что оплачивать приложения можно не только банковской картой, но и со счетов своих мобильных телефонов (Для операторов Билайн, МТС, Мегафон), а так же, что все платежи и приложения проверяются антивирусом Касперского, тем самым удаляя 99% вирусного контента.

Сейчас в нем доступно уже около 50 000 приложений, в том числе и топовые приложения из Google.Play.
Читать полностью »

Дети растут быстро. И пока они дома, они опекаются родственниками и близкими друзьями. Но вот наступает пора сделать широкий шаг в общество, в школу, на первый звонок и первый урок. Но, как говорится, в школе ещё только учатся учиться. Что заставило меня задуматься как бы я хотел, чтобы мой ребёнок шагнул в образовательную систему в XXI веке. Будучи товарищем гиковатым для себя я сделал вывод – необходим недорогой (почти одноразовый) и в чём-то ограниченный планшет. Мой выбор пал на одну и ультрабюджетных моделей рынка – PocketBook SURFpad. Почему? Попытаюсь объяснить под катом.

К аппарату буквально только что вышел и отечественный магазин Android-приложений Яндекс.Store, о котором также пойдёт речь.Читать полностью »

image
Девятнадцатого февраля Яндекс опубликовал свой годовой отчёт в которой показал годовую прибыль в 947 миллиардов долларов (рост 44% по сравнению с прошлым годом). Однако, судя по всему, предоставленная информация не оправдала ожиданий и в этот же день курс акций отечественной компании заметно упал.

Лично я надеюсь что это событие временное и скоро компания вернется к прежнему состоянию. Хотелось бы услышать ваши мнения на эту тему.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js