Развитие метода определения весов для взвешенного зонного ранжирования в информационном поиске
Опубликовано: 03.11.2012
Авторы: Сакулин С.А., Алфимцев А.Н.
Опубликовано в выпуске: #3(3)/2012
DOI: 10.18698/2308-6033-2012-3-114
Раздел: Информационные технологии
Информационный поиск на основе взвешенного зонного ранжирования подразумевает присвоение каждой зоне или полю в метаданных документов весового коэффициента с использованием методов машинного обучения.Рассмотрен метод определения весов,в котором для вычисления взвешенной зонной релевантности вместо средневзвешенного оператора применен нечеткий интеграл Шоке.Это позволяет учесть при расчетах релевантности возможные взаимозависимости между зонными показателями,что в конечном итоге повысит точность ранжирования.
Литература
[1] Manning C., Raghavan P., Schutze H. Introduction to Information Retrieval // Cambridge University Press. 2008. — P. 544
[2] Robertson S., Zaragoza H., Taylor M. Simple BM25 Extension to Multiple Weighted Field // In ACM conference on Information Knowledge Management (CIKM) // http://www.hugo-zaragoza.net/academic/pdf/robertson_cikm04.pdf. 2004. P. 42—49. Дата обращения 13.05.2012
[3] Robertson S., Walker S. Some Simple E.ective Approximations to the 2-Poisson Model for Probabilistic Weighted Retrieval // In Proceedings of the 17th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 1994. — P. 232—241
[4] Cohen W., Singer Y. Context-sensitive Learning Methods for Text Categorization // ACM Transactions on Information Systems. 1999. 17(2). — P. 141—173
[5] Murata M., Ma Q., Uchimoto K., Ozaki H., Utiama M., Isahara H. Japanese Probabilistic Information Retrieval Using Location and Category Information // The Fifth International Workshop on Information Retrieval with Asian Languages. 2000. — P. 81—88
[6] Krysta S., Burges C. A Machine Learning Approach for Improved BM25 Retrieval // http://research.microsoft.com/pubs/101323/learningbm25msrtechreport.pdf 2009. 25 р. (дата обращения 13.04.2012)
[7] Marichal J.-L. An Axiomatic Approach to the Discrete Choquet Integral as a Tool to Aggregate Interacting Criteria // IEEE Transactions on Fuzzy Systems. 2000. № 8(6). — Р. 800—807
[8] Grabisch M., Orlovski S., Yager R. Fuzzy Aggregation of Numerical Preferences// Handbook of Fuzzy Sets Series. Vol. 4: Fuzzy Sets in Decision Analysis, Operations Research and Statistics. — Dordrecht: Kluwer Academic, 1998. — Р. 31—68
[9] Sugeno M. Theory of Fuzzy Integrals and its Applications: Ph.D. Thesis. — Tokyo. 1974. — 237 р.
[10] Choquet G. Theory of capacities // Annales de l’Institut Fourier. 1953. № 5. — Р. 131—295
[11] Fallah Tehrani A., Cheng W., Hullermeier E. Preference Learning Using the Choquet Integral: The Case of Multipartite Ranking // IEEE Transactions on Fuzzy Systems // http://www.mathematik.unimarburg.de/~eyke/publications/draft_tfs11_choquet. pdf. 2012. 28 p. Дата обращения 10.06.2012
[12] Grabisch M., Kojadinovic I., Meyer P. A Review of Methods for Capacity Identification in Choquet Integral Based Multi-attribute Utility Theory: Applications of the Kappalab R package. 2008. № 2. — Р. 766—785
[13] Mayag B., Grabisch M., Labreuche Ch. A Representation of Preferences by the Choquet Integral with Respect to a 2-additive Capacity. Theory and Decision. 2011. Vol. 71. — Р. 297—324
[14] Kojadinovic I. Minimum Variance Capacity Identification // European Journal of Operational Research. 2007. № 177 (1). — Р. 498–514
[15] Алфимцев А.Н., Лычков И.И. Метод обнаружения объекта в видеопотоке в реальном времени// ВестникТГТУ. 2011. Т. 17. №1. — С. 44—55
[16] Сакулин С.А. К вопросу об идентификации параметров интеграла Шоке 2-го порядка // Вестник ИРГТУ. 2008. № 3(35). — С. 205—208