Tambov
All-Russian academic journal
“Issues of Cognitive Linguistics”

LANGUAGE PERSONALITY STRUCTURE FORMALIZATION FOR COMPUTER REPRESENTATION

LANGUAGE PERSONALITY STRUCTURE FORMALIZATION FOR COMPUTER REPRESENTATION


Author:  A.Yu. Khomenko

Affiliation:  National Research University Higher School of Economics

Abstract:  The article deals with the methods in a written language personality structure formalization for the purpose of its machine analysis.
The subject matter of the research is linguistic units that reflect the structure of a language personality and are suitable for computer interpretation. The study aims at creating a complete and interpretable language personality formal model using content analysis methods and the electronic linguistic resource elaborated by the article author.
In this paper, cognitive and psycholinguistic approaches to a language personality are combined with semantic syntax, computational linguistics and mathematical statistics methods of its analysis. While exploring the subject matter, the author has formalized some language personality parameters, identified the difficulties associated with cognitive component formalization and has proposed some ways to overcome them.
The research results could find application in the field of language theory, in the aspect of linguistic structure formalization, in cognitive linguistics and forensic authorship attribution, in psycho-, and sociolinguistics.

Keywords:  language personality, language personality levels, linguistic structure formalization,
automatic natural language processing.

References:  Апресян Ю.Д. Идеи и методы современной структурной лингвистики. М., 1966. [Apresjan Ju.D. Idei i metody sovremennoj strukturnoj lingvistiki. M., 1966.]
Баранов А.Н. Введение в прикладную лингвистику. М.: Эдиториал УРСС, 2001. [Baranov A.N. Vvedenie v prikladnuju lingvistiku. M.: Jeditorial URSS, 2001.]
Белоусов К.И. Модельная лингвистика
и проблемы моделирования языковой реальности. Модельная лингвистика и проблемы моделирования языковой реальности // Вестник Оренбургского государственного университета. 2010. № 11 (117).
С. 94-97. [Belousov K.I. Model'naja lingvistika i problemy modelirovanija jazykovoj real'nosti. Model'naja lingvistika i problemy modelirovanija jazykovoj real'nosti // Vestnik Orenburgskogo gosudarstvennogo universiteta. 2010. № 11 (117). S. 94-97.]
Белянин В.П. Основы психолингвистической диагностики: модели мира в литературе. М.: Тривола, 2000. [Beljanin V.P. Osnovy psiholingvisticheskoj diagnostiki: modeli mira v literature. M.: Trivola, 2000.]
Бессмертный И.А., Нугуманова А.Б. Метод автоматического построения тезаурусов на основе статистической обработки текстов на естественном языке // Известия томского политехнического университета. 2012. № 5. С. 125-130. [Bessmertnyj I.A., Nugumanova A.B. Metod avtomaticheskogo postroenija tezaurusov na osnove statisticheskoj obrabotki tekstov na estestvennom jazyke // Izvestija Tomskogo politehnicheskogo universiteta. 2012. № 5. S. 125-130.]
Болдырев Н.Н. Язык и структура сознания // Когнитивные исследования языка. 2016. Вып. XXIV. С. 35-48. [Boldyrev N.N. Jazyk i struktura soznanija // Kognitivnye issledovanija jazyka. 2016. Vyp. XXIV.
S. 35-48.]
Виноградов В.В. Проблема авторства и теория стилей. М.: Гослитиздат, 1961. [Vinogradov V.V. Problema avtorstva i teorija stilej. M.: Goslitizdat, 1961.]
Воркачев С.Г. Лингвокультурология, языковая личность, концепт: становление антропоцентрической парадигмы в языкознании // Филологические науки. 2001. № 1. С. 64-72. [Vorkachev S.G. Lingvokul'turologija, jazykovaja lichnost', koncept: stanovlenie antropocentricheskoj paradigmy v jazykoznanii // Filologicheskie nauki. 2001. № 1. S. 64-72.]
Воробьев В.В. Языковая личность в лингвокультурологии // Тез. докл. Языковая личность: Лингвистика. Лингвокультурология. Лингводидактика. БашГУ. Ноябрь 2011 г. Уфа: РИЦ БашГУ, 2011. С. 234-237. [Vorob'ev V.V. Jazykovaja lichnost' v lingvokul'turologii // Tez. dokl. Jazykovaja lichnost': Lingvistika. Lingvokul'turologija. Lingvodidaktika. BashGU. Nojabr' 2011 g. Ufa: RIC BashGU, 2011. S. 234-237.]
Вул С.М. Судебно-автороведческая идентификационная экспертиза: методические основы. Xарьков: ХНИИСЭ, 2007. [Vul S.M. Sudebno-avtorovedcheskaja identifikacionnaja jekspertiza: metodicheskie osnovy. Xar'kov: HNIISJe, 2007.]
Галяшина Е.И. Основы судебного речеведения: монография. М.: СТЭНСИ, 2003. [Galjashina E.I. Osnovy sudebnogo rechevedenija: мonografija. M.: STJeNSI, 2003.]
Ионова С.В., Огорелков И.В. Речевая диагностика личности по гендерному признаку в автороведении: квантитативный подход // Вестник Волгоградского государственного университета. Серия 2. Языкознание. 2020. Т. 19. № 1. С. 115-127. [Ionova S.V., Ogorelkov I.V. Rechevaja diagnostika lichnosti po gendernomu priznaku v avtorovedenii: kvantitativnyj podhod // Vestnik Volgogradskogo gosudarstvennogo universiteta. Serija 2. Jazykoznanie. 2020. T. 19. № 1. S. 115-127.]
Караулов Ю.Н. Русский язык и языковая личность. М.: ЛКИ, 2010. [Karaulov Ju.N. Russkij jazyk i jazykovaja lichnost'. M.: LKI, 2010.]
Лосев А.Ф. Введение в общую теорию языковых моделей. М.: Едиториал УРСС, 2004. [Losev A.F. Vvedenie v obshhuju teoriju jazykovyh modelej. M.: Editorial URSS, 2004.]
Мартыненко Г. Я. Стилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия. Часть 2. Первая половина XX в.: расширение междисциплинарных контактов стилеметрии к 100-летию выхода в свет статьи Николая Александровича Морозова «Лингвистические спектры: средство для отличия плагиатов от истинных произведений того или другого известного автора: стилеметрический этюд» // Структурная и прикладная лингвистика. Вып. 11: межвуз. сб. СПб.: Изд-во С.-Петерб. ун-та,
2015. С. 9-28. [Martynenko G. Ja. Stilemetriya:
vozniknovenie i stanovlenie v kontekste mezhdistsiplinarnogo vzaimodeystviya. Chast' 2. Pervaya
polovina XX v.: rasshirenie mezhdistsiplinarnykh kontaktov stilemetrii k 100-letiyu vykhoda
v svet stat'i Nikolaya Aleksandrovicha Morozova «Lingvisticheskie spektry: sredstvo dlya otlichiya plagiatov ot istinnykh proizvedeniy togo ili drugogo izvestnogo avtora: stilemetricheskiy etyud» //
Strukturnaja i prikladnaja lingvistika. Vyp. 11:
mezhvuz. sb. SPb.: Izd-vo S.-Peterb. un-ta, 2015.
S. 9-28.]
Нестерова О.А. Психолингвистический анализ мотивационных ориентиров языковой личности как инструмент выявления социально-политических взглядов говорящего (на примере публицистического дискурса В.П. Астафьева) // Политическая лингвистика. 2015. № 3 (53).
С. 218-223. [Nesterova O.A. Psiholingvisticheskij analiz motivacionnyh orientirov jazykovoj lichnosti kak instrument vyjavlenija social'no-politicheskih vzgljadov govorjashhego (na primere publicisticheskogo diskursa V.P. Astaf'eva) // Politicheskaja lingvistika. 2015. № 3 (53). S. 218-223.]
Падучева Е.В. О семантике синтаксиса. М.: Наука, 1974. [Paducheva E.V. O semantike sintaksisa. M.: Nauka, 1974.]
Радбиль Т.Б., Маркина М.В. Вероятностно-статистические модели в производстве автороведческой экспертизы русскоязычных текстов // Политическая лингвистика. 2019. № 2 (74). С. 156-166. [Radbil' T.B., Markina M.V. Verojatnostno-statisticheskie modeli v proizvodstve avtorovedcheskoj jekspertizy russkojazychnyh tekstov // Politicheskaja lingvistika. 2019. № 2 (74). S. 156-166.]
Родионова Е.С. Методы атрибуции художественных текстов // Структурная и прикладная лингвистика. 2007. Вып. 7. С. 118-127. [Rodionova E.S. Metody atribucii hudozhestvennyh tekstov // Strukturnaja i prikladnaja lingvistika. 2008. Vyp. 7. S. 118-127.]
Романова Т.В. Человек и время: Язык. Дискурс. Языковая личность. Н. Новгород: Нижегородский государственный лингвистический ун-т
им. Н.А. Добролюбова, 2011. [Romanova T.V. Chelovek i vremja: Jazyk. Diskurs. Jazykovaja lichnost'.
N. Novgorod: Nizhegorodskij gosudarstvennyj lingvisticheskij un-t im. N.A. Dobroljubova, 2011.]
Русская грамматика: научные труды: в 2 т. URL: http://rusgram.narod.ru/index.html. [Russkaja grammatika: nauchnye trudy: v 2 t. URL: http://rusgram.narod.ru/index.html.
Седов К.Ф. Становление структуры устного дискурса как выражение эволюции языковой личности: дис. ... д-ра филол. наук. Саратов, 1999. [Sedov K. F. Stanovlenie struktury ustnogo diskursa kak vyrazhenie jevoljucii jazykovoj lichnosti: dis. ... d-ra filol. nauk. Saratov, 1999.]
Степаненко А.А. Гендерная атрибуция текстов компьютерной коммуникации: статистический анализ использования местоимений // Вестник Томского государственного университета. 2017. № 415. С. 17-25. [Stepanenko A.A. Gendernaja atribucija tekstov komp'juternoj kommunikacii: statisticheskij analiz ispol'zovanija mestoimenij // Vestnik Tomskogo gosudarstvennogo universiteta. 2017. № 415. S. 17-25.]
Тарнопольский О.Б., Кожушко С.П. Культурно-обусловленные составляющие и методика формирования вторичной языковой личности
у изучающих иностранный язык в его вузовском курсе // Языковая личность и эффективная коммуникация в современном поликультурном мире: материалы V Междунар. науч.-практ. конф., посвящ. 20-летию основания каф. теории и практики перевода фак. социокультур. коммуникаций Белорус. гос. ун-та, Минск, 24-25 окт. 2019 г. Минск: БГУ, 2019. С. 300-304. [Tarnopol'skij O.B., Kozhushko S.P. Kul'turno-obuslovlennye sostavljajushhie i metodika formirovanija vtorichnoj jazykovoj lichnosti u izuchajushhih inostrannyj jazyk v ego vuzovskom kurse // Jazykovaja lichnost' i jeffektivnaja kommunikacija v sovremennom polikul'turnom mire : materialy V Mezhdunar. nauch.-prakt. konf., posvjashh. 20-letiju osnovanija kaf. teorii i praktiki perevoda fak. sociokul'tur. kommunikacij Belorus. gos. un-ta, Minsk, 24-25 okt. 2019 g. Minsk: BGU, 2019. S. 300-304.]
Badryzlova Y. Exploring Semantic Concreteness and Abstractness for Metaphor Identification and Beyond // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва,
17 июня – 20 июня 2020 г.). М.: Изд-во РГГУ, 2020. P. 33-47.
Coulthard M. Author Identification, Idiolect, and Linguistic Uniqueness // Applied Linguistics. 2004. № 24 (4). P. 431-447.
Litvinova T.A., Sboev A.G., Panicheva P.V. Profiling the Age of Russian Bloggers // Communications in Computer and Information Science. 2018. Vol. 930. P. 167-177.
McMenamin G.R. Forensic Linguistics: Advances in Forensic Stylistics. Boca Raton: CRC Press LLC, 2002.
Muttenthaler L., Lucas G., Amann J. Authorship Attribution in Fan-Fictional Texts Given Variable Length Character and Word N-Grams // Notebook for PAN at CLEF 2019, 2019. URL: http://ceur-ws.org/Vol-2380/paper_49.pdf.
Pimonova E., Durandin O., Malafeev A. Doc2vec or Better Interpretability? А Method Study for Authorship Attribution // Paper presented at Dialogue 2020, Moscow, June 15-20, 2020, 2020. URL: http://www.dialog-21.ru/media/4955/pimonovaeplusetal-132.pdf.
Shuy R.W. Creating Language Crimes: How Law Enforcement Uses (and Misuses) Language. New York: Oxford University Press, 2005.
Wright D. Using Word N-grams to Identify Authors and Idiolects: A corpus Approach to a Forensic Linguistic Problem // International Journal of Corpus Linguistics. 2017. № 22 (2). P. 212-241.

Acknowledgments:  The reported study was funded by RFBR, project number 19-31-27001.

For citation:  Khomenko, A. Yu. (2021). Abilities and difficulties in language personality structure formalization for computer representation. Voprosy Kognitivnoy Lingvistiki, 2, 111-117. (In Russ.).

Pages:  111-117

Back to the list



Login:
Password: