Пропонується метод пошуку інформації у файлах баз даних, який враховує розподіл імовірностей звертання до записів, в основі якого лежить поняття умовно середнього запису. Виводяться формули для визначення умовно середнього запису у випадку різних законів розподілу ймовірностей. Досліджується ефективність цього методу порівняно з методами послідовного перегляду та двійкового пошуку для таких законів розподілу ймовірностей як рівномірний, "бінарний", Зіпфа, узагальнений, частковим випадком якого є розподіл, що наближено задовольняє правило "80-20". За критерій ефективності прийнято математичне сподівання кількості порівнянь, необхідних для пошуку запису у файлі.
The method of the information search in database files, which considers the probability distribution of request to records, has been constructed. Formulas for identification of record, which is located in the middle of the file, under certain conditions have been proposed for different laws of distribution. The comparative analysis of efficiency of method with the linear search method and binary search method for different laws of probability distribution of requests to records has been investigated. The mathematical expectation of number of comparisons was used as an efficiency criterion.
Предлагается метод поиска информации в файлах баз данных, учитывающий распределение вероятностей обращения к записям, в основании которого лежит понятие условно средней записи. Выведены формулы для определения условно средней записи для разных законов распределения вероятностей. Исследуется эффективность метода по сравнению с методами последовательного пересмотра и двоичного поиска для таких законов распределения вероятностей обращения к записям, как равномерный, "бинарный", Зипфа, обобщенный, частным случаем которого является распределение, приближенно удовлетворяющее правило "80-20". За критерий эффективности принято математическое ожидание количества сравнений, необходимых для поиска записи в файле.