В предыдущей статье, обсуждение получилось слишком крикливым. Но мы открыли свой сайт и там я переписал более взвешенно. Написанное там рекомендую прочитать, чтобы потом не жаловаться на сложность изложения. На самом деле нужен минимум информации для понимания. Я обещал написать продолжение о своем эксперименте, поэтому те кто заинтересовался проблематикой построения эволюционных деревьев — прошу под кат. Читать полностью »
Метка «поисковые системы» - 4
Анализ генома бактерий. Продолжение
2013-02-15 в 1:27, admin, рубрики: Алгоритмы, биоинформатика, генетика, геномика, геномы, поисковые системы, происхождение видов, эволюция, метки: генетика, геномика, геномы, поисковые системы, происхождение видов, эволюцияПовышение эффективности работы в Google Chrome
2013-02-12 в 12:58, admin, рубрики: chromium, Google Chrome, адресная строка, браузеры, поиск, Поисковые машины и технологии, поисковые системы, эффективность, метки: chromium, Google Chrome, адресная строка, браузеры, поиск, поисковые системы, эффективностьПриветствую! Надеюсь, эта статья будет кому-нибудь полезна.
Многие знают о возможностях адресной строки Chrome, запоминающей поисковые системы различных сайтов. Однако эффективно ее использовать, думаю, умеют далеко не все.
Я сижу в интернете исключительно через этот браузер (дело вкуса и привычки, конечно) и использую кастомизированный поиск в Chrome по несколько десятков раз в день. Большое количество действий, ежедневно выполняемых через браузер, можно оптимизировать, добавив в список определенные поисковые системы.
Итак, кончаю муть, перехожу к «технической» и практической стороне дела.
Читать полностью »
Алгоритм определения естественности информационного всплеска
2013-02-10 в 17:44, admin, рубрики: Поисковые машины и технологии, поисковые системы, метки: поисковые системыПроект «Геном прокариот» — научный стартап
2013-02-07 в 7:44, admin, рубрики: Алгоритмы, биоинформатика, генетика, геномика, геномы, поисковые системы, происхождение видов, управление проектами, эволюция, метки: генетика, геномика, геномы, поисковые системы, происхождение видов, эволюцияЭтот проект был задуман давно. Лет 5 назад я считал, что многие результаты в геномике могут быть получены людьми далекими от биологии, коим я в полной мере являюсь. Конечно за это время я немного нахватался терминологии и немного узнал как работают специалисты. Но чем больше я узнавал как работают специалисты тем большие отторжение это у меня вызывало. Я считаю, что они явно много незаслуженно усложняют в результате чего не простая область становится не проходимой. В то время как все достаточно просто и качественно можно сделать. И да я с ними пытаюсь конкурировать (конечно, только в определенной узкой области), как бы наивно это не выглядело.
Вся проблема этого проекта — это то, что я его единственный полноценный участник. Конечно, я успел со многими за это время поговорить и многие оказали реальное влияние на проект. Всем им спасибо. Понятно, что не коммерческий проект не сильно может рассчитывать на успех. Да, действительно за каждым научным проектом стоит солидные около миллионные вливания и команда серьезных ученных. У нас этого нет, а есть лишь гуманизм и энтузиазм.
Поэтому в первую очередь я нуждаюсь в советах от тех у кого есть опыт в стартапе подобных проектов на не коммерческой основе. Во вторую очередь, нужна собственно команда программистов (от знания биологии, при необходимости, я вас освобожу :) ). А сейчас я хотел бы найти таких энтузиастов, которые могли бы обеспечить работу (скажем скромно) домашней веб-страницы проекта (прошу писать мне на почту tac@inbox.lv или личными сообщениями хабра). И конечно, важен любой другой отклик и предложения.
А ниже я расскажу идею и то на что претендует проект, а также о текущих результатах, а они в худшем случае сравнимы с теми которые дают специалисты. Но я вполне самокритичен, поэтому всегда готов выслушать критику — желательно не в мой адрес, а в адрес проекта.
Поиск будущего
2013-02-02 в 0:12, admin, рубрики: поиск, Поисковые машины и технологии, поисковые системы, поисковые технологии, метки: поиск, поисковые системы, поисковые технологииЭтот пост о боли ученых и простых людей, которым нужно найти «сложную» информацию. Так уж сложилось, что лишь немногие умеют правильно формулировать вопросы к поисковикам. Очень громкое заявление, которое захотят оспорить тысячи Знающих, но я и сам понимаю, что оно может выглядеть неправильным. Не от того, что мысль неправильна, скорее я не совсем точно сформулировал ее. Так лучше:
«С ростом сложности предмета поиска возрастает трудность формулировки запроса» — это утверждение верно для каждого человека, независимо от его способностей.
Начинаете понимать? Вы, как программисты, с легкостью формулируете простые запросы вроде «рязань москва экспресс расписание », поэтому есть стереотип, что упрощать процесс поиска не нужно. Но что происходит, когда нам нужно узнать, может ли redis не только сохранять значения с TTL, но и автоматически удалять самые старые, чтобы не свопиться на диск? Возможно и эта проблема некоторым покажется легкой для рисерча, тогда обратите внимание на одну из моих:Читать полностью »
Дарвиновская эволюция бактерий — полная картина
2013-01-05 в 8:06, admin, рубрики: Алгоритмы, биоинформатика, генетика, геномика, геномы, поисковые системы, происхождение видов, эволюция, метки: генетика, геномика, геномы, поисковые системы, происхождение видов, эволюцияЯ начну с провокационного заявления — «биологи не публикуют детали своих исследований». Казалось бы столько статей, столько исследований… но где описание и детализация информации, которая получена? Её в принципе нет. А статьи без такой информации пусты и спорны. Каждый нахваливает свой метод, но много ли кто озаботился верификацией чужих данных, а главное смог ли он её сделать?
Можно лишь приветствовать появление таких биоинформационных баз как NCBI genomes и PDB, в которые исследователи помещают данные о секвенированных геномах и структурах РНК, белков. И главное, некоторые ученные прежде чем опубликовать статью, прежде помещают данные в биоинформационные базы.
Вы скажите есть много других баз — но я вам скажу они менее серьезные, и как правило перепосты этих двух с некоторой адаптацией. Но главное, что вся другая биоинформационная информация, можно сказать вторичная — не помещается в базы. А в статьях тем не менее идут различные спекуляции.
Конечно, так оно выглядит только для таких дилетантов как я. У настоящих же профессионалов все как в аптеке. Поэтому можете не утруждать себя ответом на эти пафосные заявления. Мы просто поговорим как выглядит биоинформатика в её частных областях глазами дилетанта. Но может и вас эта история к чему нибудь побудит.
Мы поговорим ниже о построение дерева эволюции согласно Дарвину, посмотрим на сколько это справедливо и таки я в итоге дам полное дерево (в рамках имеющейся информации) эволюции бактерий на основании самых консервативных генов тРНК. И дам пояснение о методе построения такого дерева.
Специалистам в биоинформатике рекомендую читать с раздела №5, пропустив весь мой пафос.
Дебри филогенетики — демонстрация и объяснение
2012-12-31 в 9:24, admin, рубрики: Алгоритмы, биоинформатика, генетика, геномика, геномы, графы, поисковые системы, происхождение видов, эволюция, метки: генетика, геномика, геномы, графы, поисковые системы, происхождение видов, эволюцияДумаю многие ИТ-специалисты интересуются не только программированием, но и вопросами более земными и частенько их можно застать рассуждающими о происхождении человека, разума и т.д. Мы обратимся к самому началу — происхождению видов бактерий. И хотя там есть много узкоспециальных вопросов, сам принцип построения филогенетических деревьев не такой легкий, но захватывающий. О нем то мы и будем говорить.
Чуть ранее я написал статью Систематика прокариот — дальние родственники, где сообщил о грубых результатах и методе их получения. Он несколько не классический, но вполне укладывается в научную парадигму. Достаточно «жесткий» диалог с Davidov, который имел место быть в этой статье, может создать впечатление проблематичности метода о котором я говорю. Но мы потом сели и спокойно обсудили, и подвели некоторые итоги. Суть диалога представляет некоторый интерес и я его вначале частично опубликую.
А затем хочу продемонстрировать один наглядный пример построения дерева «происхождения видов» с помощью моего подхода (назовем его «детерминированный подход»). По сути метод можно обобщить, и тогда он не будет относится только к филогенетике и его можно использовать в других областях, когда нужно граф превратить в дерево, выкинув слабые связи.
Систематика прокариот — детализированные пояснения
2012-12-17 в 1:20, admin, рубрики: биоинформатика, генетика, геномика, геномы, поисковые системы, происхождение видов, эволюция, метки: генетика, геномика, геномы, поисковые системы, происхождение видов, эволюцияВ предыдущей статье я не сильно утруждал себя детальным описанием идеи. Мне казалось она интуитивна понятна и элементарна. Но после дискуссии с Davidov понял, что идею не так то просто схватить. Дело в том, что сейчас классические представления в филогенетике строятся на одной догме, которая искажает мировоззрение биологов.
Когда мы строим эволюционное дерево — мы конечно же хотим знать в какой последовательности во времени видообразовывались виды. Но классическая филогенетика объявила, что это не научно ставить такой вопрос. И по сути расписалась в своем невежестве. Действительно, судить о времени видообразования, в то время как эволюционный процесс идет каждую минуту сложно. Но можно. Пояснить как это можно и призвано данное детализированное объяснение.
Систематика прокариот — дальние родственники
2012-12-15 в 22:34, admin, рубрики: UML, Алгоритмы, биоинформатика, генетика, геномика, геномы, поисковые системы, происхождение видов, эволюция, метки: UML, генетика, геномика, геномы, поисковые системы, происхождение видов, эволюцияЕще летом я запланировал эксперимент и написал статью Использование UML для эксперимента по эволюционной систематике прокариот, и косвенно о психологии ученых. Результаты по грубой обработки уже были готовы к концу лета (спасибо, mktums за помощь ).
Вот теперь образовалась пауза, и я добил эту тему, и представляю результаты.
Как поисковые подсказки каждый день экономят человеческую жизнь
2012-12-03 в 8:12, admin, рубрики: data mining, Блог компании Яндекс, поиск, Поисковые машины и технологии, поисковые подсказки, поисковые системы, яндекс, метки: поиск, поисковые подсказки, поисковые системы, яндексПоисковые подсказки существуют в Яндексе уже больше четырёх лет. На профессиональном сленге мы называем их саджестом. Первоначально он формировался только на основе частоты тех или иных запросов. Со временем мы научили подсказки учитывать, из какого региона задаётся вопрос, связан ли он с каким-то недавним событием, можно ли показать пользователю сразу адрес сайта и какого. Ко всему прочему мы первыми из существующих поисковых систем внедрили технологию, которая позволяет саджесту учитывать предыдущий запрос пользователя и показывать ему контекстную подсказку. Теперь поисковые подсказки вступают с вами в диалог и меняются в зависимости от того, что вы только что искали.
Задача Яндекса — отвечать на вопросы, как заданные так и нет. Поиск — про заданные вопросы, но пользователю можно помочь их сформулировать. Читать полностью »