Корейский лингвистический корпус
Предмет: | Экономика |
Тип работы: | Эссе |
Язык: | Русский |
Дата добавления: | 04.05.2019 |
- Данный тип работы не является научным трудом, не является готовой работой!
- Данный тип работы представляет собой готовый результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала для самостоятельной подготовки учебной работы.
Если вам тяжело разобраться в данной теме напишите мне в whatsapp разберём вашу тему, согласуем сроки и я вам помогу!
По этой ссылке вы сможете научиться раскрывать проблему и решение в эссе:
Как раскрыть проблему и решение в эссе |
Посмотрите похожие темы возможно они вам могут быть полезны:
Судебная защита прав предпринимателей |
Применение судом еаэс права вто |
Этические аспекты использования дистанционной медицины |
Аналитическое эссе по исторической памяти семьи |
Введение:
Мы живем в эпоху всеобщего формирования информационного общества. Информационный процесс резко изменился, сделав нашу жизнь проще. Важнейшим ресурсом в современном обществе является информация. Сохранение, распространение и рациональное использование этого ресурса стало очень важным для общества. Информация, которую мы используем в нашей повседневной жизни, все в большей степени приобретает электронную форму, а традиционные печатные СМИ, классические литературные произведения и ценные музейные рукописи переводятся в информационные формы. Эта форма представления информации позволяет вам организовать свою работу и получить к ней доступ совершенно другого уровня качества.
Обеспечение публичного доступа пользователей к электронным информационным ресурсам стало одной из приоритетных задач информационных служб для науки, образования и культуры. Современные системы информационного обслуживания предоставляют неограниченный доступ практически к любой информации. В связи с этим система Интернет, которая играет важную роль с 1991 года, превратилась в уникальную и практически бесконечную информационную среду. Появление Интернета создало принципиально новую ситуацию в системе образования. Возможности сети для образовательного и личностного развития действительно уникальны. Потенциальная информация в Интернете бесконечна.
Использование интернет-ресурсов не только диверсифицирует учебный процесс, но и позволяет организовать его с учетом интересов учащихся и уровней подготовки. Обучение должно быть развивающим в том смысле, что оно развивает независимое критическое и творческое мышление. Но для этого недостаточно, чтобы в системе образования были только учителя и учебники (широко понимаемые как система учебных материалов), отражающие один аспект общества. Вам нужен широкий спектр информационных действий, разных источников, разных точек зрения и точек зрения на одни и те же проблемы. Это позволяет студентам самостоятельно мыслить и искать свою позицию.
В Интернете образовательные ресурсы используют самые разные ресурсы: от веб-страниц с интересными учебными материалами до огромных проектов. Одним из таких крупных проектов является корейский лингвистический корпус.
Разработка, создание и использование лингвистических корпусов затрагивает такие разделы лингвистики, как корпусная лингвистика. Национальный корпус - это информационно-справочная система, основанная на собрании электронных текстов.
Он может использоваться кем угодно, но в первую очередь он предназначен для людей, занимающихся изучением языка, изучением корейского языка и преподаванием. Хорошее научное устройство (обычно называемое маркировкой или аннотацией корпуса) позволяет пользователям быстро и эффективно находить примеры слов, представляющих интерес, в тексте, формах и синтаксисе. Одна из основных функций обучения корейскому языку в корпусе - служить примером для изучения конкретных ситуаций. Корпус может оказать учителям ценную помощь в поиске лингвистического материала для редактирования словарного запаса, морфологических и синтаксических индивидуальных задач, контрольных задач и задач проверки.
По словам В.А. Плунгяна: Цифровые библиотеки также широко используются в учебном процессе. Преимущества электронного формата документа перед печатным документом - надежность и компактность хранения информации, быстрое распространение и возможность широкого использования.
Корпусная лингвистика - это раздел прикладной лингвистики, который занимается разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов). |
Одним из основных источников лингвистического материала, необходимого для лингвистики и лингвистических исследований, является письменный или устный текст. На основе анализа многих текстов исследователи могут сделать вывод о лингвистических явлениях, представляющих интерес, таких как поведение грамматических структур и использование языковых средств выражения. Развитие компьютерных технологий способствовало тому, что многочисленные тексты стали доступны в электронном виде. Во всем мире начали создаваться лингвистические трупы для обработки таких больших объемов текста и извлечения необходимой информации. Коллекция текстов, специально отобранных и размеченных по различным языковым параметрам и предоставляемых поисковой системой. Увеличение объема исследовательских материалов потребовало использования новых методов анализа лингвистических данных, в том числе статистической обработки.
Таким образом, корпусная лингвистика включает в себя два аспекта. Первый - создание и разметка (аннотация) текстовых корпусов и разработка их поисковых инструментов. Наличие огромного количества электронных ресурсов значительно ускорило процесс сбора материалов для изучения языка. Однако доступность таких лингвистических данных в корне изменила основанные на фактических данных требования лингвистических исследований. В настоящее время недостаточно привести несколько примеров для подтверждения представленных концепций, но предоставить достаточно полную выборку данных на определенном языке. Однако работать с мегабайтами «необработанного» текста не так сложно, как искать примеры вручную.
Необходимость и способность обрабатывать огромные объемы текста для извлечения лингвистических, литературных и других данных привели к быстрому росту электронных ресурсов, таких как текстовые компании с лингвистической аннотацией. Используя совокупность текстов, исследователи в среде естественного языка могут наблюдать поведение лингвистических единиц интереса (слова, фразы, грамматические категории, синтаксические структуры и т. д.). Реалистичный контекст, а не искусственно построенный. Кроме того, тематические исследования могут использовать статистические методы для формулирования, подтверждения или опровержения гипотез о конкретных языковых явлениях в больших объемах материала.
Заключение
Можно сказать, что первые корпуса и корпусные методы появились задолго до возникновения корпусной лингвистики как научного направления. По сути, любое лингвистическое исследование, основанное на сопоставлении и анализе контекстов, является корпусным. Еще в конце XIX - начале XX в. в целях усовершенствования средств связи, а также в целях быстрого обучения языку создавались частотные словари. Частотность слов оценивалась по специальным выборкам текстов.
Первые корпуса в строгом смысле этого слова появились в 60-х гг. ХХ в. Прообразом для них послужили словарные картотеки - собрания фрагментов текстов, обычно в виде карточек, содержащих то или иное слово, и систематизированные относительно описываемого слова (в основном, по алфавиту). В 1963 г. в Брауновском университете (США) для создания частотного словаря американского варианта английского языка был создан большой корпус на цифровом носителе (Brown Corpus), включающий 1 млн. слов. При оценке частоты некоторого слова в языке возникает проблема "сбалансированности" выборки.
В языке частотность многих слов обусловлена тематикой текстов. Так, например, слово «переменная» будет чрезвычайно частотно в математических текстах. Вероятность же встретить данное слово в художественной литературе очень мала. Для обеспечения корректности данных относительно частоты употребления слов создатели корпуса (У. Френсис и Г. Кучера) разработали строгую процедуру отбора текстов: в корпус вошли 500 фрагментов прозаических текстов, относящихся к 15 наиболее массовым жанрам и напечатанных в 1961г.
Возникновение корпусных методов связано с бурным развитием компьютерных технологий во второй половине ХХ в. Возможность сканирования и распознавания текста (перевод в текстовый формат), появление баз данных и систем управления базами данных сделали возможным сбор, хранение и обработку огромных массивов текстовых данных. Не последнюю роль в развитии корпусной лингвистики сыграла популяризация мировой сети Интернет, т.к. корпуса стали доступны широкому кругу пользователей, значительно расширились возможности их наполнения. С тех пор накоплен значительный опыт разработки и применения корпусов. Ежегодно публикуется множество работ по данной тематике.