Формування та репрезентація складних слів для комп’ютерної обробки: підхід універсального семантичного представлення з Панінійської перспективи

##plugins.themes.bootstrap3.article.main##

##plugins.themes.bootstrap3.article.sidebar##

  Сударшан Ґаутам

  С. Сукхада

Анотація

Розуміння семантичної структури складних утворень є центральною проблемою як у теоретичній, так і в комп’ютерній лінгвістиці. Universal Semantic Representation (USR) забезпечує обчислювально придатну структуру для репрезентації значення у впорядкований та мовно-незалежний спосіб, спираючись на індійську граматичну традицію (Indian Grammatical Tradition, IGT). У цьому дослідженні принципи словоскладання Паніні застосовуються до структури USR з метою аналізу складних конструкцій з панінійської перспективи. Хоча такі принципи, як ākāṅkṣā (очікуваність) та yogyatā (семантична узгодженість), є фундаментальними для семантичної інтерпретації, дослідження особливо демонструє, як специфічні панінійські обмеження, включно з “saviśeṣaṇānāṃ vṛttir na” та “vṛttasya vā viśeṣaṇayogo na”, допомагають розв’язувати неоднозначності сфери модифікатора в автоматизованих системах і семантичному парсингу. У статті також розглядається внутрішня семантична організація складних виразів та ієрархічні відношення, що виникають у вкладених і складних композитних конструкціях. Інтеграція цих положень у структуру USR демонструє, яким чином семантика складних утворень, відношення залежності та контекстуальна інтерпретація можуть бути систематично репрезентовані між мовами для комп’ютерної обробки. Приклади, взяті з підручників географії мовою гінді, ілюструють практичну застосовність запропонованого аналізу та підкреслюють значення панінійської граматики для розвитку комп’ютерних підходів до семантичної репрезентації та Natural Language Generation (NLG). У дослідженні проаналізовано 1504 речення з підручників географії мовою гінді та встановлено, що щільність складних утворень у технічних розділах сягає приблизно 52 %, що, своєю чергою, зумовлює необхідність систематичної логіки для репрезентації вкладених композитних структур і збереження семантичної цілісності. Результати свідчать, що інтеграція панінійських граматичних положень із USR робить вагомий внесок у моделі Natural Language Processing (NLP) для індійських мов шляхом підвищення семантичної точності, інтерпретаційної послідовності та комп’ютерної репрезентації складних мовних структур. Дослідження підкреслює незмінну актуальність традиційних індійських граматичних теорій у сучасній комп’ютерній лінгвістиці та дослідженнях репрезентації знань.

Як цитувати

Ґаутам, С., & Сукхада, С. (2026). Формування та репрезентація складних слів для комп’ютерної обробки: підхід універсального семантичного представлення з Панінійської перспективи. Сходознавство, (97), 183–228. https://doi.org/10.15407/skhodoznavstvo2026.97.183
Переглядів статті: 0 | Завантажень PDF: 0

##plugins.themes.bootstrap3.article.details##

Ключові слова

vṛtti, граматика Паніні, ekārthībhāva-sāmarthya, словоскладання, семантична сумісність, Universal Semantic Representation

Посилання
Ācārya D. (ed.) (2014), Nyāya-darśanam (Vātsyāyana-bhāṣya-sahitam), 7th ed., Chowkhamba Sanskrit Bhavan, Varanasi.
Amarasiṃha (1971), Amarakosha, Ed. by A. A. Ramanathan, Madras: The Adyar Library and Research Centre, available at: https://archive.org/details/amarkosh_english_202311/mode/2up (accessed 13.05.2026).
Dīkṣita B., Sarasvatī J., Dīkṣita V. and Bhaṭṭa N. (2022), Vaiyākaraṇa-siddhānta-kaumudī with Tattva-bodhinī, Bāla-manoramā and Laghu-śabdendu-śekhara (G. Śāstrī, S. Śāstrī and B. Śāstrī, eds), reprint, Vol. 1, Chaukhamba Surabharati Prakashan, Varanasi.
Bhaṭṭa N. (2006), Parama-laghu-mañjūṣā (Mishra Vanshidhar, ed.), First ed., Chaukhamba Sanskrit Pratishthan, Delhi.
Bhattāchārya G. and Mishra J. (2016), Vyutpatti-vāda jayākhyā-vyākhyayā sahitā (U. Mishra, ed.), reprint, Vol. 1, Vāṇī Vilāsa Prakāśana, Varanasi.
Bhikshu G. (1983), Sarvatantra-siddhānta-padārtha-lakṣaṇa-saṅgraha, 2nd ed., Gujarati Patra, Mumbai.
Cardona G. (1997), Pāṇini: His Work and Its Traditions. Volume One: Background and Introduction, Motilal Banarsidass, Delhi.
Garg K., Paul S., Sukhada, Bawahir F. and Kumari R. (2023), “Evaluation of Universal Semantic Representation (USR)”, ACL Anthology, available at: https://aclanthology.org/2023.dmr-1.2/ (accessed 3 February 2026).
Geography (316) Syllabus (n.d.), The National Institute of Open Schooling (NIOS), available at: https://nios.ac.in/online-course-material/sr-secondary-courses/Geography-(316).aspx (accessed 3 February 2026).
Hock H. H. (1991), Principles of Historical Linguistics, 2nd ed., Mouton de Gruyter, Berlin.
Iyer K. A. S. (1974), The Vākyapadīya of Bhartṛhari, Chapter III (English Translation), Motilal Banarsidass, Delhi.
Jha V. N. (ed. and transl.) (2010), Tarkasaṅgraha of Annambhatta: English Translation with Notes, Chinmaya International Foundation Shodha Sansthan, Ernakulam, Kerala.
Kulkarni A. (2007), “Sanskrit and Computational Linguistics”, paper presented at the First International Symposium on Sanskrit Computational Linguistics, Paris, 30 October 2007.
Lowe J. J. (2015), “The Syntax of Sanskrit Compounds”, Language, Vol. 91, No. 3, pp. e71–e115, available at: https://doi.org/10.1353/lan.2015.0034 (accessed 4 June 2026).
Miśra R. (2015), Aṣṭādhyāyī-sūtra-pāṭhaḥ (Pāṇini-muni-praṇītaḥ) Vārtika-gaṇapāṭha-dhātupāṭha-liṅgānuśāsana-vimarśa-sahitaḥ, Motīlāla Banārasīdāsa, New Delhi.
Molina-Muñoz P. (2013), “Sanskrit Compounds and the Architecture of the Grammar”, in Grammatica and Verba: Glamour and Verve: Studies in South Asian, Historical, and Indo-European Linguistics in Honour of Hans Henrich Hock on the Occasion of His Seventy-Fifth Birthday (S. Fukuda Chen and B. Slade, eds), pp. 181–201, Beech Stave Press, Ann Arbour.
Pañcholi B. (ed.) (2011), Vaiyākaraṇa-bhūṣaṇa-sāraḥ with Prabhā Commentary of Bālakṛṣna-pañcolī and Darpaṇa of Harivallabha-śāstrī, Chowkhamba Sanskrit Sansthan, Varanasi.
Patañjali, Kaiyaṭa and Bhaṭṭa N. (2018), Vyākaraṇa-mahābhāṣyam, Bhāṣya-pradīpa-Pradīpodyota-sahitam (B. S. Jośī, ed.), reprint, Vol. 2, Caukhambā Saṃskṛta Pratiṣṭhāna, Delhi.
Sastri P. S. S. (2015), Lectures on Patañjali’s Mahābhāṣya, Vol. 5 (Āhnikas 15–22), The Kuppuswami Sastri Research Institute, Chennai.
Staal F. (1972), “The Science of Language”, Scientific American, Vol. 227, No. 3, pp. 73–82.
Sukhada (2017), A Paṇinian Perspective to Information Dynamics in Language: Mapping Structures between English and Hindi, PhD dissertation, International Institute of Information Technology (IIIT), Hyderabad.
Varadarājācārya (2004), Laghu-siddhānta-kaumudī (R. D. Paṇḍeya, ed.), 33rd ed., Gita Press, Gorakhpur.
Viśvanātha Pañcanana and Kṛṣṇavallabhācārya (2018), Nyāya-siddhānta-muktā-valī with the Commentary Kiraṇā-valī (N. Śāstrī and Ś. Śāstrī, eds.), reprint, Vol. 1, Caukhambā Saṃskṛta Saṃsthāna, Varanasi.
Yāska (2004), Nirukta-śāstram (Bhagavaddatta, ed.), Second ed., Vol. 1, Ramlal Kapoor Trust, Delhi.
Website
Ashtadhyayi.com (n.d.), Panini’s Ashtādhyāyī with Annotations and Tools, available at: https://ashtadhyayi.com (accessed 3 February 2026).