Кто не делится найденным, подобен свету в дупле секвойи (древняя индейская пословица)
Версия для печати
Библиографическая запись: . — Текст : электронный // Myfilology.ru – информационный филологический ресурс : [сайт]. – URL: https://myfilology.ru//177/ (дата обращения: 28.02.2024)
Корпусная лингвистика
Во-первых, знание основ этой ветви науки о языке входит в требования к кругозору любого лингвиста с высшим образованием. Эту цель можно назвать информирующей. Во-вторых, методы корпусной лингвистики могут быть чрезвычайно полезны и для перевода текстов. В этом аспекте данный курс даёт студентам возможность овладеть инструментами, которые облегчают труд переводчика.
Понятие лингвистического корпуса
Корпус есть собрание отрывков текстов в электронной форме, отобранных в соответствии с внешними критериями, чтобы наиболее полно представлять язык или вариацию языка. Функционирует как источник данных для лингвистических исследований. (John Sinclair)
История корпусной лингвистики
Корпусная лингвистика сделала возможным:
1. Уточнить результаты и выводы проведённых ранее исследований речи.
2. Произвести новые, более широкие и системные (по охвату эмпирического речевого материала) лингвистические исследования.
Основные задачи и направления корпусной лингвистики. Взаимодействие корпусной лингвистики и компьютерной (computational) лингвистики
В качестве своей главной цели изучаемая нами наука видит объективное лингвистическое описание языковой системы, причём к этому описанию корпусная лингвистика подходит от изучения конкретной человеческой коммуникации, от реальных текстов, которые ранее рассматривались лишь как досадная помеха.
Предмет исследования корпусной лингвистики. Развитие лингвистических корпусов в мире: первое и второе поколение
Как и вся наука о языке, корпусная лингвистика занимается в основном описанием и объяснением сущности, структуры и использования языка, а так же более частными вопросами: изучение языков, их изменение и т.п.
Корпусы: устные и письменные, одноязычные и многоязычные
Большие современные корпусы обычно комбинированные, с преобладанием письменных текстов. Даже в BNC лишь 10% текстов устные. Выделяется ICE, в котором 60% текстов устные.
Корпусы: аннотированные и неаннотированные. Лингвистическая аннотация (разметка) и метаданные
Под лингвистической аннотацией или разметкой корпуса (по-английски linguistic markup) подразумевается наличие в корпусе неких данных, не являющихся частью текста, но несущих какую-то информацию о нём (так называемые метаданные).
Лингвистические исследования на базе корпусов
Лингвистические корпусы составляют, чтобы предоставить основу для более точного и адекватного описания структурных и функциональных параметров языка.
Извлечение информации из корпуса
Лингвистическая информация из корпуса извлекается при помощи специальных компьютерных программ. Есть два основных источника разработки подобных программ.
Создание собственного корпуса
Многие лингвисты работают с уже существующими масштабными корпусами — например, с British National Corpus или с корпусом Cobuild Project. Тем не менее, часто возникает необходимость изучить какие-то тексты, до сих пор не вошедшие в известные корпусы.
Корпусная лингвистика как раздел языкознания
Корпусная лингвистика — раздел языкознания, занимающийся разработкой, созданием и использованием текстовых корпусов. Термин введён в употребление в 1960-е годы в связи с развитием практики создания корпусов, которому начиная с 1980-х способствовало развитие вычислительной техники.
Корпусы и корпусная лингвистика. Основные понятия
Корпусная лингвистика – раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с использованием компьютерных технологий. Под названием лингвистический, или языковой, корпус текстов понимается большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач.