Предназначена для индексирования файлов и быстрого нахождения файла на локальном диске
Поддерживаются все файловые атрибуты для поиска
Инвертированный индекс - структура данных, в которой каждому термину выделена строка. Каждая строка содержит сведения о документах, в которых встречается термин, числе вхождений и относительной позиции термина внутри каждого документа. Благодаря инвертированному индексу можно быстро определить степень соответствия документов критерию поиска с использованием статистических и вероятностных формул.
Первоначально происходит сканирование текстовой информации файлов. В процессе сканирования строится инвертированный индекс. Поиск ведется с использованием инвертированного индекса с одновременным вычислением релевантности документа.
Результаты выдаются в упорядоченном виде в соответствии с релевантностью запросу. Релевантность документа запросу вычисляется на основе статистической информации полученной в процессе индексирования. Формула широко известна. Дело как всегда в деталях.
Да можно. Первоначально все документы имееют одинаковый ранг. Ранг можно менять соответственно востребованности документа. У чаще востребованных документов ранг повышается. Так более высокий ранг можно назначить документам что были открыты позже, либо модифицированны позже.
Программа высокоинтеллектуальна и при большой фантазии обыграет Вас в шахматы, порассуждает об искусстве и т.д. Это, конечно, шутка. Используется чистая теория вероятности и не более.
Надеюсь да.
Пишите. Помощи буду рад.
В ближайшее время планирую реализовать механизм подключаемых фильтров. Так что если нужный Вам формат не поддерживается - не расстраивайтесь. Вы получите возможность расширять данную функциональность по Вашему усмотрению.
В данном случае буду рад исходнику с комментариями.
В ближайшем будущем таких планов нет. Есть известный проект подобного рода в Open Source - называется он Lucene. Первоначально был реализоваи на Java. Сейчас портируется на C.
Откровенно говоря - это моя визитная карточка. Хотелось бы зарабатывать деньги на этом. Open Source здесь мне не предлагает ничего. Только ради известности :) здесь несколько моих статей с исходниками: статьи.
"Стукнись об стену." Принимаются конструктивные замечания и предложения.
Нарастить функциональность. + ... А вообще идей масса, чтобы сделать конфетку - нужно время. Потенциальным "конкурентам" я не помошник :).
Планы есть - нужна поддержка.
Да конкурентов мы знаем - потенциально мы сильнее :).
Емельянчик Виталий - разработчик программы StopKa. О себе