РОЗРОБКА СИСТЕМИ ГЕНЕРАЦІЇ НА ОСНОВІ АЛГОРИТМУ ШТУЧНОГО ІНТЕЛЕКТУ. ЧАСТИНА 2
DOI:
https://doi.org/10.20535/1970.69(1).2025.331890Ключові слова:
генерація, аналіз, препроцесинг, математичний алгоритм, нейронна мережа, машинне навчанняАнотація
Під штучним інтелектом часто розуміють певний алгоритм або ансамбль моделей машинного навчання, що надає змогу вирішувати прикладні задачі різного характеру, найчастіше з присутньою характерною нелійнійністю, з урахуванням специфіки області дослідження та можливості застосування нетривіальних підходів. Однією з таких задач є завдання генерації нових об’єктів чи поєднань. В даній роботі розглядається повний цикл розробки системи генерації, починаючи від збору даних, завершуючи готовою моделлю з елементами штучного інтелекту. Зазвичай моделі та алгоритми, що використовуються, потребують набір початкових даних, який забезпечує навчання та пошук певних закономірностей, та в подальшому може бути використаний для інших досліджень. Перша частина статті присвячена вирішенню задачі формування набору даних. Було розглянуто методи захисту інтернет-джерел, розроблено парсер для автоматичного збору даних з електронних джерел та ресурсів, виконано препроцесінг отриманої інформації та виконано композицію датасету комбінацій слів. Це найбільш трудоємкий та важливий етап у розробці системи генерації, адже всі подальші результати, їх якість та достовірність, повністю залежать від повноти, чистоти та правильності сформованих даних. Друга частина присвячена наступним етапам розробки системи генерації, а саме візуалізації даних, налаштуванню параметрів математичної моделі та перевірка згенерованих результатів. На етапі формування датасету інформація представляється у табличному вигляді, тому важливим етапом є візуальний аналіз. В даній роботі для візуалізації використовуються вектори ембедингу, що отримані через просту нейронну мережу Word2Vec, оскільки дані представляються у текстовому вигляді. Ці вектори трансформуються у двовимірний простір за допомогою методу t-SNE. В якості моделі генерації на останньому етапі розробки системи застосовується алгоритм класичного машинного навчання Ланцюг Маркова. Такий підхід надає можливість створювати відносно просту, але ефективну систему, що в повній мірі відповідає процесу моделювання для знаходження нових закономірностей та поєднань.
Посилання
V. Verezhinskyi, A. Danylenko, S. Rupich, and S. Tsybulnyk, “Design of generation system based on artificial intelligence algorithm. Part 1”, Bull. Kyiv Polytech. Inst. Ser. Instrum. Mak., is. 65(1), pp. 110–116, Jun. 2023. https://doi.org/10.20535/1970.65(1).2023.283455 (In Ukrainian)
word2vec [Online]. Available: https://code.google.com/archive/p/word2vec/
T. Mikolov, K. Chen, G. Corrado, J. Dean, “Efficient Estimation of Word Representations in Vector Space,” In Proceedings of Workshop at ICLR. 2013.
T. Mikolov, W.-T. Yih, G. Zweig, “Linguistic Regularities in Continuous Space Word Representations,” in Proceedings of NAACL HLT. 2013.
fastText – Library for efficient text classification and representation learning [Online]. Available: https://fasttext.cc/
Van der Maaten L., Hinton G., “Visualizing data using t-SNE,” Journal of machine learning research, vol. 9, № 11, 2008.
W. K. Ching , M. K. Ng, "Markov chains," Models, algorithms and applications, vol.650, pp. 111-139, 2006.
Kulasiri D. et al., “Visualizing Markov Process Through Graphs and Trees,” Chemical Master Equation for Large Biological Networks: State-space Expansion Methods Using AI., pp. 55-80, 2021.
Dr. Salim El Rouayheb, Chapter 9: Markov Chains. ECE541: Stochastic Signals and Systems [Online]. 2018. Available: https://eceweb1.rutgers.edu/~csi/ECE541/Chapter9.pdf
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Вережинський В. А., Даниленко А. В., Рупіч С. С., Цибульник С. О.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Авторське право на публікацію залишається за авторами.
Автори можуть використовувати власні матеріали в інших публікаціях за умови посилання на збірник наукових праць "Вісник Київського політехнічного інституту. Серія ПРИЛАДОБУДУВАННЯ" як на перше місце видання та на Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» як на видавця.
Автори публікують свої статті в збірнику на умовах ліцензії Creative Commons:
- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії CC BY 4.0, яка дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на динаміці цитування опублікованої роботи.
Видавець (КПІ ім. Ігоря Сікорського) має право за будь-якого використання цього видання зазначати своє ім'я або вимагати такого зазначення.
Редакційна колегія залишає за собою право розміщувати опубліковані в збірнику статті в різних інформаційних базах для надання відкритого доступу до матеріалів з метою популяризації наукових досліджень та підвищення цитованості авторів.