РОЗРОБКА СИСТЕМИ ГЕНЕРАЦІЇ НА ОСНОВІ АЛГОРИТМУ ШТУЧНОГО ІНТЕЛЕКТУ. ЧАСТИНА 1

Автор(и)

  • Валерій Вережинський Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна
  • Андрій Даниленко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна
  • Сергій Рупіч Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна https://orcid.org/0000-0001-8237-7001
  • Сергій Цибульник Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна http://orcid.org/0000-0002-4462-0936

DOI:

https://doi.org/10.20535/1970.65(1).2023.283455

Ключові слова:

генерація, аналіз, препроцесинг, математичний алгоритм, нейронна мережа, машинне навчання

Анотація

Розвиток сучасних інструментів і методів штучного інтелекту забезпечує широкий функціонал у різних наукових і прикладних сферах та надає можливість досягати нових результатів. Постає питання щодо застосування елементів штучного інтелекту для знаходження нових поєднань і сполучень шляхом генерації. В якості цільового результату розглядається застосування нейронної мережі для формування нових, унікальних рецептів харчової суміші, з метою визначення ефективності впровадження та використання методів і моделей штучного інтелекту. Для вирішення задачі генерації поєднань складових рецептів, у роботі розглянуто всі етапи технологічного процесу від збору, аналізу, препроцесингу даних до вибору математичного алгоритму та моделювання навченої системи. Кожен з етапів роботи містить у собі повний опис кроків, необхідних для вирішення поставленого завдання. Алгоритм машинного навчання має можливість обробляти тисячі прикладів для знаходження певної закономірності поєднань інгредієнтів. І значна увага приділяється формуванню тренувального датасету.

На етапі збору даних розглядаються особливості та основні проблеми, що виникають при роботі парсера. Важливою частиною є обхід захисних технологій при запитах до інтернет-ресурсів та зчитування DOM-дерева з коду HTML сторінки. Описано налаштування алгоритму автоматизованого збору інформації. Для розробки парсеру в роботі використовуються інструменти для швидкого розгортання проєкту та ефективного керування додатками Docker та Docker Compose. Окремим етапом є побудова датасету та аналіз даних для моделі нейронної мережі, який полягає у проведенні препроцесінгу та декодуванні і композиції у табличний вигляд. При автоматизованому процесі збору даних формується інформація зі значними шумами та зайвими елементами. Значна увага приділяється саме процесу очищення та підготовки корисної інформації, адже саме від чистоти даних та їх повноти в більшості випадків залежить якість математичної моделі та процесу моделювання для знаходження нових закономірностей та поєднань.

Біографії авторів

Валерій Вережинський , Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

кафедра комп’ютерно-інтегрованих оптичних та навігаційних систем

Андрій Даниленко, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

кафедрa комп’ютерно-інтегрованих оптичних та навігаційних систем

Сергій Рупіч, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

к.т.н., асистент

кафедра комп’ютерно-інтегрованих оптичних та навігаційних систем

Сергій Цибульник , Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

к.т.н., доцент кафедри комп’ютерно-інтегрованих оптичних та навігаційних систем

Посилання

D. Foster, A. O. M. C. Safari, Generative deep learning. O’Reilly Media, Inc. 2022.

T. Sousa, J. Correia, V. Pereira, M. Rocha, “Generative deep learning for targeted compound de-sign”, J. Chem. Inf. Model, vol. 61, no. 11, pp. 5343–5361, 2021. DOI: 10.1021/acs.jcim.0c01496

A. Creswell, T. White [et. al.], “Generative Adversarial Networks: An Overview”, IEEE Signal Pro-cessing Magazine, vol. 35, no. 1, pp. 53-65, 2018. [Online]. Available: https://arxiv.org/pdf/1710.07035.pdf

S. Raschka, Python machine learning. Packt Publishing ltd., 2015

A. Bhat, Data Collection Methods: Sources & Examples. [Online]. Available: https://www.questionpro.com/blog/data-collection-methods/

S. Gupta, G. Kaiser, D. Neistadt, P. Grimm, “DOM-based Content Extraction of HTML Documents”, in Proceedings of the 12th international conference on World Wide Web, pp. 207-217, 2003. DOI: 10.1145/775152.775182

What Is An API (Application Programming Inter-face)? [Online]. Available: https://aws.amazon.com/what-is/api/?nc1=h_ls

Docker overview. [Online]. Available: https://docs.docker.com/get-started/overview/

M. Walker, Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data and extract key insights, 1st Edition. Packt Publishing, 2020

##submission.downloads##

Опубліковано

2023-06-30

Як цитувати

[1]
В. Вережинський, А. Даниленко, С. Рупіч, і С. Цибульник, «РОЗРОБКА СИСТЕМИ ГЕНЕРАЦІЇ НА ОСНОВІ АЛГОРИТМУ ШТУЧНОГО ІНТЕЛЕКТУ. ЧАСТИНА 1», Bull. Kyiv Polytech. Inst. Ser. Instrum. Mak., вип. 65(1), с. 110–116, Чер 2023.

Номер

Розділ

АВТОМАТИЗАЦІЯ ТА ІНТЕЛЕКТУАЛІЗАЦІЯ ПРИЛАДОБУДУВАННЯ