Можно ли применить известный трюк с операцией XOR, используемый для поиска в списках одного или двух пропущенных чисел, сделав так, чтобы он подошёл бы для поиска тысяч отсутствующих идентификаторов в таблицах, содержащих миллионы строк?
Рубрика «XOR»
Расширение известного трюка с XOR на миллиарды строк: введение в обратимые фильтры Блума
2025-08-12 в 11:52, admin, рубрики: XOR, Алгоритмы, фильтры блумаНейросети без градиентов: спектральное моделирование и построение решений
2025-06-01 в 18:11, admin, рубрики: XOR, классификация, нейросети, обучение без градиента, сверточные нейросети, функции активацииВведение
Современные искусственные нейронные сети демонстрируют впечатляющие результаты — от классификации изображений до генерации текста. Но несмотря на повсеместное использование, суть их работы остаётся для многих скорее метафорой, чем алгоритмом.
Мы привыкли к терминологии: веса определяют вклад входа, нейроны применяют нелинейные функции, глубина сети увеличивает выразительность моделиЧитать полностью »
Файловая система без фокусов: как hard links и XOR сэкономят ваши гигабайты
2024-11-02 в 6:00, admin, рубрики: backup, file system, hard links, python, raid, raid5, windows, XORПредыстория
При проектировании программного обеспечения порой возникают неожиданные вопросы. Мой коллега задал один такой вопрос, когда решал, как устроить работу с файлами в веб-приложении. Методы взаимодействия с файлами давно отработаны, и существуют две основные стратегии: хранить файлы прямо в базе данных или записывать в базу данных только ссылки, а сам файл оставить в файловой системе сервера.
Читать полностью »
Трюк с XOR для собеседований и не только
2021-01-21 в 8:55, admin, рубрики: trick, XOR, Алгоритмы, Программирование
Есть целая куча популярных задач для собеседований, которые можно решить одним из двух способов: или логичным применением стандартных структур данных и алгоритмов, или использованием некоторых свойств XOR сложным для понимания способом.
Хоть и непривычно ожидать решения с XOR на собеседованиях, довольно забавно разбираться, как они работают. Оказывается, все они основаны на одном фундаментальном трюке, который я постепенно раскрою в этом посте. Далее мы рассмотрим множество способов применения этого трюка с XOR, например, при решении популярной задачи с собеседований:
Дан массив из n — 1 целых чисел, находящихся в интервале от 1 и n. Все числа встречаются только один раз, за исключением одного числа, которого нет. Найдите отсутствующее число.
Разумеется, существует множество прямолинейных способов решения этой задачи, однако есть и довольно неожиданный, в котором применяется XOR.
Читать полностью »
Достаём мастер-пароль из заблокированного менеджера паролей 1Password 4
2019-02-21 в 11:44, admin, рубрики: 1password, windows api, XOR, информационная безопасность, мастер-пароль, парольный менеджер, разработка под windows, реверс-инжиниринг, СофтНовые инструменты, старые методы. Проводим обратную разработку и находим фатальный недостаток 1Password.
Все любят менеджеры паролей. Они великолепны по многим причинам. Лично у меня в менеджере более 200 записей. С таким большим количеством конфиденциальных данных в одном месте важно понимать масштаб ущерба в случае компрометации вашей записи, будь то вредоносные программы, эксплоиты или просто компьютер, оставленный без присмотра на несколько минут. Washington Post недавно опубликовала статью, основанную на нашем исследовании. Эта статья помогает довести людей, что не все менеджеры паролей одинаковы.
Я свято верил, что заблокированный парольный менеджер надёжно защищён. Если кто-то получит доступ к моему компьютеру, то максимум может рассчитывать на кучку случайных байтов, поскольку информация надёжно вычищается из памяти.
Читать полностью »
Двоично-троичная битовая магия
2018-03-11 в 16:21, admin, рубрики: java, XOR, битовая магия, Занимательные задачки, математика, Программирование, системы счисления, сложениеСуществует классическая задача для собеседований, часто формулируемая следующим образом:
Имеется массив натуральных чисел. Каждое из чисел присутствует в массиве ровно два раза, и только одно из чисел не имеет пары. Необходимо предложить алгоритм, который за минимальное число проходов по массиву определяет число, не имеющее пары.
Полагаю, никто не обидится, если я тут же приведу и решение задачи: уникальный элемент будет совпадать с -суммой всех элементов массива, вычисляемой за линейное время.
Предлагаю поразмыслить над другой вариацией данной задачи. Что, если все элементы, кроме искомого, будут присутствовать в массиве не парами, а тройками? Насколько при этом усложнится решение и останется ли оно линейным?
Быстрое восстановление данных. Чем нам помогут LRC?
2017-06-08 в 13:38, admin, рубрики: lrc, raid6, XOR, Алгоритмы, Блог компании RAIDIX, Восстановление данных, высокая производительность, доступность данных, математика, системное программирование, метки: lrc
В современном мире наблюдается экспоненциальный рост объемов данных. Перед вендорами СХД возникает целый ряд задач, связанных с колоссальными объемами информации. Среди них — защита пользовательских данных от потери и максимально быстрое восстановление данных в случае выхода из строя сервера или диска.
Читать полностью »
Как применение кодов избыточности в SDS помогает Яндексу дёшево и надёжно хранить данные
2016-10-05 в 15:12, admin, рубрики: mds, XOR, Блог компании Яндекс, дата-центры, коды Рида-Соломона, Облачные вычисления, реплики, хранение данных, хранилища данных, хранилище файловЯндекс, как и любая другая большая интернет-компания, хранит много, а точнее очень много данных. Это и пользовательские данные из разных сервисов, и намайненные сайты, и промежуточные данные для расчёта погоды, и резервные копии баз данных. Стоимость хранения ($/ГБ) — один из важных показателей системы. В этой статье я хочу рассказать вам про один из методов, который позволил нам серьезно удешевить хранилище.
В 2015 году, как вы все помните, сильно вырос курс доллара. Точнее, расти-то он начал в конце 2014-го, но новые партии железа мы заказывали уже в 2015-м. Яндекс зарабатывает в рублях, и поэтому вместе с курсом выросла и стоимость железа для нас. Это заставило нас в очередной раз подумать о том, как сделать, чтобы в текущий кластер можно было положить больше данных. Мы такое, конечно, делаем регулярно, но в этот раз мотивация была особенно сильной. Кстати, если после поста у вас останутся вопросы, которые бы вы хотели обсудить лично, приходите на нашу встречу.
Каждый сервер кластера предоставляет для нас следующие ресурсы: процессор, оперативную память, жёсткие диски и сеть. Сеть здесь — более сложное понятие, чем просто сетевая плата. Это ещё и вся инфраструктура внутри дата-центра, и связность между разными дата-центрами и точками обмена трафиком. В кластере для обеспечения надёжности применялась репликация, и суммарный объём кластера определялся исключительно через суммарную ёмкость жёстких дисков. Нужно было придумать, как обменять оставшиеся ресурсы на увеличение места.
Шифрование в NQ Vault оказалось обычным XOR-ом, и это не самое плохое
2015-04-04 в 10:19, admin, рубрики: epic fail, mobile development, NQ Vault, security by obscurity, XOR, информационная безопасность, Разработка под android, шифрование, метки: NQ VaultNQ Vault — довольно популярное (30 млн. пользователей) Android приложение (есть версия и для iOS), позволяющее зашифровать выбранные SMS, фотографии и видео на устройстве. Просмотреть зашифрованный контент можно через приложение, введя пароль. Приложение получило хорошие отзывы и обзоры в ведущих ИТ изданиях.
Пользователь GitHub ninjadoge24 решил проверить, насколько хорошо приложение защищает приватные данные.
Читать полностью »


