Обновленное Руководство по товарным знакам 2024 от наших экспертов.
Получить бесплатно →
Патент
Прекратил действие
Изобретение № 2648572

Алгоритм поиска в компьютерных системах и базах данных

Правообладатель: Общество с ограниченной ответственностью "Инвестиционная группа "Коперник" (RU) Авторы: Старостин Анатолий Сергеевич (RU)
Формула изобретения

1. Способ получения ритмических соответствий между музыкальной информацией и текстовой информацией в компьютерных системах и базах данных, включающий индексацию текстовой информации, ввод запроса и поиск по индексу, заключающийся в том, что для индексации базы текстов, хранящихся в базе данных, с использованием системы поиска вычисляют ритмические характеристики текстов, а именно векторы, кодирующие ритмические свойства отдельных строк текста и всего текста в целом, причем построение векторов системой поиска происходит в два этапа, на первом этапе строка сегментируется на слоги, после чего в строке автоматически проставляются ударения и на выходе первого этапа в строке текста расставлены границы слогов и для каждого из них указано, ударный это слог, безударный или система поиска не может однозначно определить его ударность, а на втором этапе система поиска вычисляет вектор для каждой строки текста, после чего вычисляет агрегированный вектор для всего текста, который определяет ритмическую структуру этого текста, затем агрегированный вектор сохраняют в хранилище векторов, поддерживающем функцию поиска ближайших соседей, после этого осуществляют ввод запроса в текстовом или псевдотекстовом виде для нахождения текстовых данных, подходящих звуковых данных, для чего осуществляют ввод запроса в виде текста или псевдотекста или в виде звуковой записи, которую алгоритм распознавания пения трансформирует в псевдотекст, а затем осуществляют поиск по индексу, для чего производится сопоставление, с одной стороны, векторов, имеющихся в хранилище, поддерживающем функцию поиска ближайших соседей, с другой стороны, вычисленного вектора для введенного текста или псевдотекста.

2. Способ по п. 1, отличающийся тем, что поиск по индексу осуществляют в два этапа, на первом этапе производят грубый поиск, а именно в хранилище векторов ищут N наиболее похожих (близких) векторов, где N - заранее заданное число, на втором этапе осуществляют точное ранжирование результатов грубого поиска, в процессе которого все тексты, возвращенные грубым поиском, поочередно сопоставляют с текстом запроса и определяют способ сопоставления строк двух текстов друг с другом, при котором суммарное расстояние между векторами сопоставленных строк является минимальным.

3. Способ по п. 1, отличающийся тем, что поиск по индексу осуществляют с учетом тегов.

4. Способ получения ритмических соответствий между текстовой информацией и музыкальной информацией в компьютерных системах и базах данных, включающий индексацию музыкальной информации, ввод запроса и поиск по тексту, заключающийся в том, что для индексации музыкальной информации ее ритмические свойства вводят в систему поиска с помощью псевдотекста, содержащего сведения об ударениях, соответствующих сильным и слабым долям, или с помощью введения в систему мелодической линии музыкального произведения в виде звуковой записи, которую алгоритм распознавания пения трансформирует в псевдотекст с проставленными ударениями, и сохраняют в хранилище псевдотекстов, поддерживающем функцию поиска ближайших соседей, после этого осуществляют ввод запроса в виде текста, после чего по этому тексту с ударениями, автоматически проставленными системой морфологического анализа, вычисляют вектор, а затем осуществляют поиск по хранилищу псевдотекстов для нахождения подходящей музыкальной информации, для чего производят сопоставление, с одной стороны, псевдотекстов, имеющихся в хранилище, поддерживающем функцию поиска ближайших соседей, а с другой стороны, текста введенного запроса.

5. Способ по п. 4, отличающийся тем, что поиск по тексту осуществляют с учетом тегов.

показать больше
Спасибо! Мы перезвоним вам в ближайшее время!