Корейский лингвистический корпус

Предмет: Экономика
Тип работы: Эссе
Язык: Русский
Дата добавления: 04.05.2019

 

 

 

 

  • Данный тип работы не является научным трудом, не является готовой работой!
  • Данный тип работы представляет собой готовый результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала для самостоятельной подготовки учебной работы.

Если вам тяжело разобраться в данной теме напишите мне в whatsapp разберём вашу тему, согласуем сроки и я вам помогу!

 

По этой ссылке вы сможете научиться раскрывать проблему и решение в эссе:

 

Как раскрыть проблему и решение в эссе

 

Посмотрите похожие темы возможно они вам могут быть полезны:

 

Судебная защита прав предпринимателей
Применение судом еаэс права вто
Этические аспекты использования дистанционной медицины
Аналитическое эссе по исторической памяти семьи

 

Введение:

 

Мы живем в эпоху всеобщего формирования информационного общества. Информационный процесс резко изменился, сделав нашу жизнь проще. Важнейшим ресурсом в современном обществе является информация. Сохранение, распространение и рациональное использование этого ресурса стало очень важным для общества. Информация, которую мы используем в нашей повседневной жизни, все в большей степени приобретает электронную форму, а традиционные печатные СМИ, классические литературные произведения и ценные музейные рукописи переводятся в информационные формы. Эта форма представления информации позволяет вам организовать свою работу и получить к ней доступ совершенно другого уровня качества.

Обеспечение публичного доступа пользователей к электронным информационным ресурсам стало одной из приоритетных задач информационных служб для науки, образования и культуры. Современные системы информационного обслуживания предоставляют неограниченный доступ практически к любой информации. В связи с этим система Интернет, которая играет важную роль с 1991 года, превратилась в уникальную и практически бесконечную информационную среду. Появление Интернета создало принципиально новую ситуацию в системе образования. Возможности сети для образовательного и личностного развития действительно уникальны. Потенциальная информация в Интернете бесконечна.

Использование интернет-ресурсов не только диверсифицирует учебный процесс, но и позволяет организовать его с учетом интересов учащихся и уровней подготовки. Обучение должно быть развивающим в том смысле, что оно развивает независимое критическое и творческое мышление. Но для этого недостаточно, чтобы в системе образования были только учителя и учебники (широко понимаемые как система учебных материалов), отражающие один аспект общества. Вам нужен широкий спектр информационных действий, разных источников, разных точек зрения и точек зрения на одни и те же проблемы. Это позволяет студентам самостоятельно мыслить и искать свою позицию.

В Интернете образовательные ресурсы используют самые разные ресурсы: от веб-страниц с интересными учебными материалами до огромных проектов. Одним из таких крупных проектов является корейский лингвистический корпус.

Разработка, создание и использование лингвистических корпусов затрагивает такие разделы лингвистики, как корпусная лингвистика. Национальный корпус - это информационно-справочная система, основанная на собрании электронных текстов.

Он может использоваться кем угодно, но в первую очередь он предназначен для людей, занимающихся изучением языка, изучением корейского языка и преподаванием. Хорошее научное устройство (обычно называемое маркировкой или аннотацией корпуса) позволяет пользователям быстро и эффективно находить примеры слов, представляющих интерес, в тексте, формах и синтаксисе. Одна из основных функций обучения корейскому языку в корпусе - служить примером для изучения конкретных ситуаций. Корпус может оказать учителям ценную помощь в поиске лингвистического материала для редактирования словарного запаса, морфологических и синтаксических индивидуальных задач, контрольных задач и задач проверки.

По словам В.А. Плунгяна: Цифровые библиотеки также широко используются в учебном процессе. Преимущества электронного формата документа перед печатным документом - надежность и компактность хранения информации, быстрое распространение и возможность широкого использования.

Корпусная лингвистика - это раздел прикладной лингвистики, который занимается разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов).

 

Одним из основных источников лингвистического материала, необходимого для лингвистики и лингвистических исследований, является письменный или устный текст. На основе анализа многих текстов исследователи могут сделать вывод о лингвистических явлениях, представляющих интерес, таких как поведение грамматических структур и использование языковых средств выражения. Развитие компьютерных технологий способствовало тому, что многочисленные тексты стали доступны в электронном виде. Во всем мире начали создаваться лингвистические трупы для обработки таких больших объемов текста и извлечения необходимой информации. Коллекция текстов, специально отобранных и размеченных по различным языковым параметрам и предоставляемых поисковой системой. Увеличение объема исследовательских материалов потребовало использования новых методов анализа лингвистических данных, в том числе статистической обработки.

Таким образом, корпусная лингвистика включает в себя два аспекта. Первый - создание и разметка (аннотация) текстовых корпусов и разработка их поисковых инструментов. Наличие огромного количества электронных ресурсов значительно ускорило процесс сбора материалов для изучения языка. Однако доступность таких лингвистических данных в корне изменила основанные на фактических данных требования лингвистических исследований. В настоящее время недостаточно привести несколько примеров для подтверждения представленных концепций, но предоставить достаточно полную выборку данных на определенном языке. Однако работать с мегабайтами «необработанного» текста не так сложно, как искать примеры вручную.

Необходимость и способность обрабатывать огромные объемы текста для извлечения лингвистических, литературных и других данных привели к быстрому росту электронных ресурсов, таких как текстовые компании с лингвистической аннотацией. Используя совокупность текстов, исследователи в среде естественного языка могут наблюдать поведение лингвистических единиц интереса (слова, фразы, грамматические категории, синтаксические структуры и т. д.). Реалистичный контекст, а не искусственно построенный. Кроме того, тематические исследования могут использовать статистические методы для формулирования, подтверждения или опровержения гипотез о конкретных языковых явлениях в больших объемах материала.

Корейский лингвистический корпус

Заключение

Можно сказать, что первые корпуса и корпусные методы появились задолго до возникновения корпусной лингвистики как научного направления. По сути, любое лингвистическое исследование, основанное на сопоставлении и анализе контекстов, является корпусным. Еще в конце XIX - начале XX в. в целях усовершенствования средств связи, а также в целях быстрого обучения языку создавались частотные словари. Частотность слов оценивалась по специальным выборкам текстов.

Первые корпуса в строгом смысле этого слова появились в 60-х гг. ХХ в. Прообразом для них послужили словарные картотеки - собрания фрагментов текстов, обычно в виде карточек, содержащих то или иное слово, и систематизированные относительно описываемого слова (в основном, по алфавиту). В 1963 г. в Брауновском университете (США) для создания частотного словаря американского варианта английского языка был создан большой корпус на цифровом носителе (Brown Corpus), включающий 1 млн. слов. При оценке частоты некоторого слова в языке возникает проблема "сбалансированности" выборки.

В языке частотность многих слов обусловлена тематикой текстов. Так, например, слово «переменная» будет чрезвычайно частотно в математических текстах. Вероятность же встретить данное слово в художественной литературе очень мала. Для обеспечения корректности данных относительно частоты употребления слов создатели корпуса (У. Френсис и Г. Кучера) разработали строгую процедуру отбора текстов: в корпус вошли 500 фрагментов прозаических текстов, относящихся к 15 наиболее массовым жанрам и напечатанных в 1961г.

Возникновение корпусных методов связано с бурным развитием компьютерных технологий во второй половине ХХ в. Возможность сканирования и распознавания текста (перевод в текстовый формат), появление баз данных и систем управления базами данных сделали возможным сбор, хранение и обработку огромных массивов текстовых данных. Не последнюю роль в развитии корпусной лингвистики сыграла популяризация мировой сети Интернет, т.к. корпуса стали доступны широкому кругу пользователей, значительно расширились возможности их наполнения. С тех пор накоплен значительный опыт разработки и применения корпусов. Ежегодно публикуется множество работ по данной тематике.