Рубрика «Семантическая Сеть» - 3

Как и для чего мы сделали свой валидатор микроразметки

2013-01-14 в 10:27, admin, рубрики: semantic web, Блог компании Яндекс, валидация, микроразметка, Микроформаты, Семантическая Сеть, яндекс.вебмастер, метки: semantic web, валидация, микроразметка, семантическая сеть, яндекс.вебмастер

Недавно мы писали о нашем валидаторе семантической разметки. А сегодня хотим рассказать, зачем и почему он был сделан, какие сложности возникли при разработке и как мы с ними справились. Одна из причин, по которой мы его сделали, конечно, в том, что мы хотели избавить роботов от встреч с ошибками вебмастеров. Но руководствовались мы не только этим.

Медленно, но верно семантическая разметка набирает популярность. Чуть больше десяти лет назад (в мае 2001 года) впервые был введен термин «семантическая паутина». В 2004 году появилось первое упоминание формата RDFa, примерно тогда же начали развиваться микроформаты. В июне 2011 года был запущен стандарт schema.org.

Сейчас семантическую микроразметку поддерживают и Яндекс, и другие ведущие мировые поисковые системы.

Однако вебмастера часто сталкиваются с тем, что валидаторы HTML выдают массу ошибок. Читать полностью »

MilkyWeb — Graph of Everything

2012-12-23 в 10:57, admin, рубрики: big data, semantic web, графы, онтологии, Семантическая Сеть, социальные сети, Социальные сети и сообщества, я пиарюсь, метки: big data, semantic web, графы, онтологии, социальные сети

MilkyWeb — Graph of Everything

В данной статье я хочу поделиться своими мыслями по поводу способов решения фундаментальных проблем современного Интернета. Хочу описать модель, которая, по моему мнению, может помочь ещё лучше упорядочить знания в интернете, и продемонстрировать свою попытку реализации такой модели.
Читать полностью »

Открытое письмо: Мир, в котором я придумал Ingress или Тебе всё равно никто не поверит

2012-12-21 в 0:34, admin, рубрики: Google, ingress, Гаджеты. Устройства для гиков, Семантическая Сеть, метки: Google, ingress

Открытое письмо: Мир, в котором я придумал Ingress или Тебе всё равно никто не поверит

читатель! Я написал около десятка черновиков и названий для этого поста. Я выждал месяц, для того чтобы жгучее желание «написать всё-и-сейчас» не превратило эту запись в поток бессвязных мыслей без начала и конца. Я прочитал все упоминания о предмете моего рассказа. Я прочитал все комментарии к этим записям. Зачем всё это? Всё просто. Дело в том, что некоторым образом, игру Ingress придумал я.

Читать полностью »

Создание частотного словаря на основе анализа библиотеки художественной литературы

2012-12-12 в 9:42, admin, рубрики: Компьютерная лингвистика, оптимизация кода, Песочница, Семантическая Сеть, структуры данных, метки: Компьютерная лингвистика, оптимизация кода, структуры данных

Общий привет.

Недавно, для шлифовки морфологического словаря, способного (предположительно) генерировать все возможные формы слова из инфинитива — мне понадобился достаточно объемный частотный словарь русского языка. Частотный словарь — вещь очень простая, слова в нем упорядочены по частоте, с которой они встречаются в анализируемом тексте.
Читать полностью »

Google запускает «Сеть знаний»

2012-12-09 в 22:20, admin, рубрики: Google, поиск, Поисковые машины и технологии, Семантическая Сеть, метки: Google, поиск

Эрик Шмидт давно говорил о том, что поисковая система должна уметь понимать, что вы хотите найти, не заставляя вас писать точный запрос. Похоже, что семантический поиск такого плана стал на чуточку ближе. 7 декабря в Google запустили новую технологию «Сеть знаний» на русском языке (впервые она появилась в мае этого года в англоязычном поиске). В течение нескольких дней с этого момента у всех пользователей при поисковых запросах, распознанных «Сетью», справа от результатов поиска будет появляться расширенная карточка запроса с разной релевантной информацией, которую вроде бы не запрашивали, но которая действительно может ответить на ещё не заданный вопрос.

Читать полностью »

Text Mining Framework (Java)

2012-11-10 в 20:50, admin, рубрики: artificial intelligence, data mining, java, text mining, Семантическая Сеть, метки: artificial intelligence, data mining, java, text mining, семантическая сеть

Что это и для кого (вместо вступления)

В данной статье я бы хотел рассказать о небольших результатах своей научной деятельности в сфере Text Mining. Этими самыми «результатами» стал небольшой FrameWork, который, пока еще, и до либы то не очень дотягивает, но мы растем =). Данный проект — реализация на практике некоторых, разработанных мною, теоретических положений. Как следствие этого я представляю возможности, которыми он может потенциально обладать в конце внедрения всех идей. Названо сее творение: «Text Mining FrameWork»(TextMF). Давайте в кратце рассмотрим, что именно будет позволять TextMF в своей первой финальной версии и что работает уже сейчас.
Читать полностью »

Идеальное хранилище документов

2012-09-09 в 16:30, admin, рубрики: django, python, Анализ и проектирование систем, архивация, документооборот, Семантическая Сеть, файлохранилища, метки: Django, python, архивация, документооборот, файлохранилища

Иногда очень хочется быстро найти нужный файл. С учетом того, что файлов — сотни тысяч, а ты не знаешь ни его названия, ни содержания, ни типа — ничего. Зато приблизительно знаешь категории. И хочется его быстро вычислить и сразу же отредактировать и записать.
На сегодня удобных кросс-платформенных open-source файлопомоек с прямым доступом к файлам — НЕТ.
Далее речь пойдет не о медиабиблиотеке и не о semaweb — а о простой и удобной системе управления громадной файлопомойкой с прямым доступом к файлам.
Читать полностью »

Организация и оптимизация информационного пространства пользователя

2012-08-22 в 13:06, admin, рубрики: интерфейсы, облако тегов, онтологии, Песочница, Поисковые машины и технологии, предметная область, Семантическая Сеть, метки: облако тегов, онтологии, предметная область, семантическая сеть

Ежедневно, выполняя свои должностные и прочие функции, современный человек сталкивается с задачей анализа большого объема информации и поиска необходимых ему данных. Со временем происходит накопление пользовательских данных в виде документов. Эти документы в сумме составляют некоторое информационное пространство пользователя. С каждым новым документом все острее встает вопрос организации этого пространства: с течением времени из пары – тройки папок с иерархически – расположенными в них файлами получается огромная кипа документов, которую достаточно сложно привести к иерархической форме с линейными связями. Перед нами встает задача конкретизации, категоризации и визуализации информационного пространства пользователя.
Читать полностью »

Универсальный валидатор микроразметки в Яндекс.Вебмастере

2012-07-30 в 11:56, admin, рубрики: microdata, schema.org, Блог компании Яндекс, валидация, Микроформаты, Семантическая Сеть, яндекс.вебмастер, метки: microdata, schema.org, валидация, яндекс.вебмастер

В последнее время вебмастера используют семантическую микроразметку все чаще: по нашим данным, сейчас 10% страниц рунета размечены, и это число постоянно растет. А вслед за популярностью микроразметки растет и потребность вебмастеров в дополнительных ее видах. И не только тех, которые поддерживает Яндекс. Именно поэтому мы решили сделать валидатор микроразметки в Яндекс.Вебмастере универсальным. Для начала мы научили его проверять корректность всех типов разметки Schema.org и microdata.

Пример валидации разметки Product (Schema.org):Читать полностью »

SPARQL запросы к содержимому HTML страниц

2012-07-11 в 8:50, admin, рубрики: grab, python, semantic web, sparql, Семантическая Сеть, метки: grab, python, semantic web, sparql

Здравствуйте.
После посещения одной конференции у меня появилась идея, воплощение которой я и представляю.
Данный пост предоставляет пример работы с библиотеками grab и rdflib, а также готовый класс для выполнения SPARQL запросов к содержимому web-страниц.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «Семантическая Сеть» - 3

Как и для чего мы сделали свой валидатор микроразметки

MilkyWeb — Graph of Everything

Открытое письмо: Мир, в котором я придумал Ingress или Тебе всё равно никто не поверит

Создание частотного словаря на основе анализа библиотеки художественной литературы

Google запускает «Сеть знаний»

Text Mining Framework (Java)

Идеальное хранилище документов

Организация и оптимизация информационного пространства пользователя

Универсальный валидатор микроразметки в Яндекс.Вебмастере

SPARQL запросы к содержимому HTML страниц

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «Семантическая Сеть» - 3

Новости

Актуальные темы

Архив