Linguistic and technological aspects of linguistic corpora construction. |
Лингвистические и технологические аспекты создания корпусов. |
Language researches based on linguistic corpora. |
Исследование языка на основе лингвистических корпусов. |
Reverso Context is an online and mobile application combining big data from large multilingual corpora to allow users to search for translations in context. |
Reverso Context - это мобильное и веб-приложение, объединяющее данные из различных многоязычных корпусов с целью поиска перевода в контексте. |
One of the ways the BNC was to be differentiated from existing corpora at that time was to open up the data not just to academic research, but also to commercial and educational uses. |
Одним из отличий BNC от существовавших корпусов того времени была открытость данных для использования не только в научных исследованиях, но и в коммерческих, и образовательных целях. |
In contrast to other well-known corpora and corpus archives (such as the British National Corpus), however, the German Reference Corpus is explicitly not designed as a balanced corpus: The distribution of DeReKo texts across time or text types does not match some predefined percentages. |
В отличие от других известных корпусов (таких как, например, Британский национальный корпус), DeReKo нацелен на охват максимально возможного объёма текстов, а не на сбалансированность их состава: распределение текстов по времени создания или по типу текста не соответствует заранее заданным процентным соотношениям. |
Example-based machine translation systems are trained from bilingual parallel corpora containing sentence pairs like the example shown in the table above. |
Пример двуязычного корпуса Системы машинного перевода на основе примеров состоят из двуязычных параллельных корпусов, содержащих пары предложений, как пример, приведённый в таблице выше. |
The ANC differs from other corpora of English because it is richly annotated, including different part of speech annotations (Penn tags, CLAWS5 and CLAWS7 tags), shallow parse annotations, and annotations for several types of named entities. |
ANC отличается от других корпусов английского языка широкой аннотированностью, включая различные частеречевые разметки (Penn tags, CLAWS5 и CLAWS7 tags), аннотации поверхностного синтаксического анализа и аннотации для нескольких типов именованных объектов. |
The analysis and processing of various types of corpora are also the subject of much work in computational linguistics, speech recognition and machine translation, where they are often used to create hidden Markov models for part of speech tagging and other purposes. |
Анализ и обработка разных типов корпусов являются предметом большинства работ в области компьютерной лингвистики (например, извлечение ключевых слов), распознавания речи и машинного перевода, в которых корпусы часто применяются при создании скрытых марковских моделей для маркирования частей речи и других задач. |
Unlike on-line searchable corpora, which due to copyright restrictions allow access only to individual sentences, the entire ANC is available to enable research involving, for example, development of statistical language models and full-text linguistic annotation. |
В отличие от онлайновых корпусов текстов, которые из-за ограничений, обусловленных авторским правом, предоставляют доступ только к отдельным предложениям, весь корпус текстов ANC доступен для проведения исследований, включая разработку статистических языковых моделей и полнотекстовых лингвистических аннотаций. |
The ANC and its sub-corpora differ from similar corpora primarily in the range of linguistic annotations provided and the inclusion of modern genres that do not appear in resources like the British National Corpus. |
ANC и его подкорпуса отличаются от аналогичных текстовых корпусов главным образом характеристиками лингвистических аннотаций и включением текстов современных жанров, которые не содержатся в таких ресурсах, как, например, Британский национальный корпус. |
Statistical machine translation (SMT) is a machine translation paradigm where translations are generated on the basis of statistical models whose parameters are derived from the analysis of bilingual text corpora. |
Статистический машинный перевод (англ. Statistical machine translation - SMT) - разновидность машинного перевода, где перевод генерируется на основе статистических моделей, параметры которых являются производными от анализа двуязычных корпусов текста (text corpora). |
A special kind of speech corpora are non-native speech databases that contain speech with foreign accent. |
Особый вид речевых корпусов - это базы данных текстов, наговоренных людьми, не являющимися носителями языка, которые содержат речь с иностранным акцентом. |