После выхода из озера Чейбеккель, температура воды в котором не больше 9 градусов, слышу крики организаторов: «Переодевайте её, у вас несколько минут, уложиться в лимит на беговую транзитку до велосипеда».
Рубрика «Блог компании HFLabs»
Ты пожалеешь, но будет поздно: как я участвовала в единственном в России экстремальном триатлоне
2023-08-11 в 7:55, admin, рубрики: Блог компании HFLabs, жизнь, здоровый образ жизни, здоровье, мозг, отпуск, природа, спорт, триатлон, хоббиКак определить оператора и регион по номеру телефона
2020-02-20 в 11:10, admin, рубрики: Блог компании HFLabs, номер телефона, определить оператора по номеру, определить регион по номеру, открытые данные, Разработка под e-commerce, сотовая связь, сотовый оператор, телефонная связь
Полезно знать, какого телефонного оператора выбрал клиент и в каком регионе. Тогда можно разбить клиентскую базу географически и не звонить ночами. Или проводить промоакции вместе с операторами. А некоторые наши заказчики экономят: для каждого оператора выбирают самого дешевого СМС-агрегатора.
Поэтому «Дадата» с давних пор находит оператора по номеру телефона. Алгоритм простой — сделай и пользуйся. Разве что в 2013 году, когда отменили «мобильное рабство», пришлось чуть скорректировать процесс. В этой статье расскажу, как у нас все работает.
В процессе есть большая сложность — получить доступ к базе перенесенных номеров. Частным лицам его не выдают, да и компаниям придется тяжело. Об этом — в отдельном разделе.
Читать полностью »
Как посчитать «похожесть» номеров в паспортах. И найти одинаковые даже с опечатками
2020-01-15 в 10:52, admin, рубрики: cdi, data mining, data quality, Алгоритмы, Анализ и проектирование систем, Блог компании HFLabs, дедупликация, документы, информационная безопасность, качество данных, номера паспортов, паспорта
Продукты HFLabs ищут дублированных клиентов в базах федеральных компаний. Очевиднейший способ найти одинаковые клиентские карточки — сравнить паспорта или другие документы, удостоверяющие личность.
Раньше мы сравнивали номера документов строго: одинаковые — отлично, нет — извините. На ручной разбор из-за опечатки в номере уходили даже те карточки, у которых совпадали ФИО и адреса́ проживания. Такой подход излишне нагружал персонал заказчиков.
Поэтому мы с головой залезли в данные, изучили статистику и вывели критерии — когда разные номера действительно разные, а когда дело в опечатках. Рассказываю, как работает алгоритм.
Читать полностью »
Как проверить паспорт на действительность
2019-12-05 в 14:00, admin, рубрики: CRM-системы, Алгоритмы, Блог компании HFLabs, информационная безопасность, паспорт, паспорта, паспортные данные, подлинность паспорта, проверка подлинности, Разработка веб-сайтов, реквизиты паспорта
Реквизиты паспорта — не просто набор цифр, в них закодирован вагон информации. Если правильно расшифровывать и сопоставлять реквизиты, подозрительные документы мгновенно всплывут на поверхность. Продукты HFLabs уже 14 лет проверяют клиентские данные в банках, страховых, телекомах и другом крупном бизнесе. Расскажу, как мы распознаем ошибки в российских паспортах.
Читать полностью »
Хакатон в небольшой компании: как устроить, не вваливая вагон ресурсов
2019-11-07 в 11:51, admin, рубрики: Блог компании HFLabs, командный дух, развитие персонала, Развитие стартапа, управление людьми, управление персоналом, хакатон, Хакатоны
Это статья о том, как я впервые провел хакатон для команды. Прокачанным организаторам материал наверняка покажется слишком простым, а история — наивной. Я ориентировался на тех, кто только знакомится с форматом и думает, устраивать ли такое мероприятие.
HFLabs делает сложные штуки с данными: мы чистим и обогащаем контакты клиентов для больших компаний и строим клиентские базы на сотни миллионов записей. В московских офисах трудятся 65 человек, еще около десятка — удаленно из других городов.
Любая работа порой не то чтобы надоедает, но становится пресноватой. В этот момент полезно сменить фокус, попробовать что-то новое. Поэтому мы с полгода присматривались к хакатонам.
Хакатон — это такое состязание для айтишников: несколько команд собираются и два дня подряд решают сложные задачи. Обычно соревнуясь за приз, который присуждает жюри.
Нам хотелось опробовать формат и развлечься, но классический хакатон — довольно масштабная, хлопотная и дорогая затея. Поэтому мы провели лайт-версию почти без бюджета. А в итоге остались довольны и даже сделали кое-что полезное.
Читать полностью »
Как наладить поиск адреса по координатам (и где взять нужный справочник)
2019-09-19 в 12:29, admin, рубрики: api, dadata.ru, Maps API, OpenStreetMap, адрес по координатам, Блог компании HFLabs, Геоинформационные сервисы, геокоординаты, обратное геокодирование, открытые данные
Весной мы добавили в API DaData.ru фичу «Обратное геокодирование», она же «Адрес по координатам». Название намекает: метод принимает геокоординаты и отдает данные об адресе.
Солидный продукт с той же функциональностью сделал «Яндекс» — он называется «Геокодер». Но сервис «Яндекса» бесплатен только для открытых некоммерческих проектов. Стандартный же тариф — от 120 000 ₽ в год — подходит не всем.
Мы подумали — если сделать бесплатную или недорогую альтернативу, разработчики наверняка скажут спасибо. И сделали, благо подготовили к тому времени сильные стартовые позиции:
- Справочник адресов с координатами, собранный и проверенный собственноручно.
- Готовое и отлаженное API.
В статье расскажу, как мы создали «Адрес по координатам»: наладили поиск, собрали справочник и упаковали в готовый метод.
Читать полностью »
Собрали всем «Хабром» справочник «Кем выдан…» для паспортов. Качайте на здоровье
2019-04-18 в 11:02, admin, рубрики: data quality, Блог компании HFLabs, качество данных, Клиентская оптимизация, краудсорсинг, открытые данные, паспорта, паспортные данные, подсказки при вводе, Разработка веб-сайтов, справочники
С пару месяцев назад мы поэкспериментировали: получится ли на «Хабре» собрать справочник подразделений, выдающих российские паспорта. Дело полезное: эти данные нужны много кому, канонического источника нет, а существующие — очень так себе.
И знаете, все получилось. Пригодный к использованию справочник готов, можно качать и пользоваться. А еще мы сделали подсказки, которые ускоряют ввод подразделений в формы.
Читать полностью »
Эксперимент: собираем справочник подразделений УФМС, выдающих паспорт
2019-02-28 в 11:04, admin, рубрики: data quality, Блог компании HFLabs, качество данных, открытые данные, паспорта, паспортные данные, подсказки при вводе, Разработка веб-сайтов, Разработка под e-commerce, уфмс
Самое утомительное поле при вводе паспорта — «Кем выдан». Вбивать в форму какое-нибудь «Отделом внутренних дел Медведевского района республики Марий Эл» муторно. Люди злятся, сокращают название как придется, ошибаются.
Было бы здо́рово подсказывать варианты по коду подразделения.
Читать полностью »
Все ругают самописные тестовые фреймворки. А мы своим довольны
2019-01-24 в 12:14, admin, рубрики: ddt, ttd, автотесты, Анализ и проектирование систем, Блог компании HFLabs, надежность, тестирование, Тестирование IT-систем, Тестирование веб-сервисов, тестирование по, управление разработкой, фреймворк, юнит-тесты
Меня зовут Елена Расторгуева, я отвечаю за продукт «Фактор» в HFLabs. «Фактор» — чертовски сложный алгоритмический enterprise, он обрабатывает данные в промышленных масштабах.
В статье я расскажу, как мы начинали тестировать «Фактор», как развивали автотесты и почему пришли к самописным фреймворкам.
Читать полностью »