РОЗРОБКА СИСТЕМИ ГЕНЕРАЦІЇ НА ОСНОВІ АЛГОРИТМУ ШТУЧНОГО ІНТЕЛЕКТУ. ЧАСТИНА 2

Автор(и)

  • Валерій Вережинський Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» , Україна image/svg+xml
  • Андрій Даниленко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» , Україна image/svg+xml
  • Сергій Рупіч Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» , Україна image/svg+xml https://orcid.org/0000-0001-8237-7001
  • Сергій Цибульник Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» , Україна image/svg+xml https://orcid.org/0000-0002-4462-0936

DOI:

https://doi.org/10.20535/1970.69(1).2025.331890

Ключові слова:

генерація, аналіз, препроцесинг, математичний алгоритм, нейронна мережа, машинне навчання

Анотація

Під штучним інтелектом часто розуміють певний алгоритм або ансамбль моделей машинного навчання, що надає змогу вирішувати прикладні задачі різного характеру, найчастіше з присутньою характерною нелійнійністю, з урахуванням специфіки області дослідження та можливості застосування нетривіальних підходів. Однією з таких задач є завдання генерації нових об’єктів чи поєднань. В даній роботі розглядається повний цикл розробки системи генерації, починаючи від збору даних, завершуючи готовою моделлю з елементами штучного інтелекту. Зазвичай моделі та алгоритми, що використовуються, потребують набір початкових даних, який забезпечує навчання та пошук певних закономірностей, та в подальшому може бути використаний для інших досліджень. Перша частина статті присвячена вирішенню задачі формування набору даних. Було розглянуто методи захисту інтернет-джерел, розроблено парсер для автоматичного збору даних з електронних джерел та ресурсів, виконано препроцесінг отриманої інформації та виконано композицію датасету комбінацій слів. Це найбільш трудоємкий та важливий етап у розробці системи генерації, адже всі подальші результати, їх якість та достовірність, повністю залежать від повноти, чистоти та правильності сформованих даних. Друга частина присвячена наступним етапам розробки системи генерації, а саме візуалізації даних, налаштуванню параметрів математичної моделі та перевірка згенерованих результатів. На етапі формування датасету інформація представляється у табличному вигляді, тому важливим етапом є візуальний аналіз. В даній роботі для візуалізації використовуються вектори ембедингу, що отримані через просту нейронну мережу Word2Vec, оскільки дані представляються у текстовому вигляді. Ці вектори трансформуються у двовимірний простір за допомогою методу t-SNE. В якості моделі генерації на останньому етапі розробки системи застосовується алгоритм класичного машинного навчання Ланцюг Маркова. Такий підхід надає можливість створювати відносно просту, але ефективну систему, що в повній мірі відповідає процесу моделювання для знаходження нових закономірностей та поєднань.

Біографії авторів

Валерій Вережинський, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

приладобудівний факультет, кафедра комп’ютерно-інтегрованих оптичних та навігаційних систем

Андрій Даниленко , Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

приладобудівний факультет, кафедра комп’ютерно-інтегрованих оптичних та навігаційних систем

Сергій Рупіч, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

приладобудівний факультет, кафедра комп’ютерно-інтегрованих оптичних та навігаційних систем

к.т.н., асистент

Сергій Цибульник, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

приладобудівний факультет, кафедра комп’ютерно-інтегрованих оптичних та навігаційних систем

к.т.н, доцент

Посилання

V. Verezhinskyi, A. Danylenko, S. Rupich, and S. Tsybulnyk, “Design of generation system based on artificial intelligence algorithm. Part 1”, Bull. Kyiv Polytech. Inst. Ser. Instrum. Mak., is. 65(1), pp. 110–116, Jun. 2023. https://doi.org/10.20535/1970.65(1).2023.283455 (In Ukrainian)

word2vec [Online]. Available: https://code.google.com/archive/p/word2vec/

T. Mikolov, K. Chen, G. Corrado, J. Dean, “Efficient Estimation of Word Representations in Vector Space,” In Proceedings of Workshop at ICLR. 2013.

T. Mikolov, W.-T. Yih, G. Zweig, “Linguistic Regularities in Continuous Space Word Representations,” in Proceedings of NAACL HLT. 2013.

fastText – Library for efficient text classification and representation learning [Online]. Available: https://fasttext.cc/

Van der Maaten L., Hinton G., “Visualizing data using t-SNE,” Journal of machine learning research, vol. 9, № 11, 2008.

W. K. Ching , M. K. Ng, "Markov chains," Models, algorithms and applications, vol.650, pp. 111-139, 2006.

Kulasiri D. et al., “Visualizing Markov Process Through Graphs and Trees,” Chemical Master Equation for Large Biological Networks: State-space Expansion Methods Using AI., pp. 55-80, 2021.

Dr. Salim El Rouayheb, Chapter 9: Markov Chains. ECE541: Stochastic Signals and Systems [Online]. 2018. Available: https://eceweb1.rutgers.edu/~csi/ECE541/Chapter9.pdf

##submission.downloads##

Опубліковано

2025-06-28

Як цитувати

[1]
В. Вережинський, А. Даниленко, С. Рупіч, і С. Цибульник, «РОЗРОБКА СИСТЕМИ ГЕНЕРАЦІЇ НА ОСНОВІ АЛГОРИТМУ ШТУЧНОГО ІНТЕЛЕКТУ. ЧАСТИНА 2», Bull. Kyiv Polytech. Inst. Ser. Instrum. Mak., вип. 69(1), с. 70–74, Чер 2025.

Номер

Розділ

АВТОМАТИЗАЦІЯ ТА ІНТЕЛЕКТУАЛІЗАЦІЯ ПРИЛАДОБУДУВАННЯ