Linguistic and technological aspects of linguistic corpora construction. | Лингвистические и технологические аспекты создания корпусов. |
Language researches based on linguistic corpora. | Исследование языка на основе лингвистических корпусов. |
One of the ways the BNC was to be differentiated from existing corpora at that time was to open up the data not just to academic research, but also to commercial and educational uses. | Одним из отличий BNC от существовавших корпусов того времени была открытость данных для использования не только в научных исследованиях, но и в коммерческих, и образовательных целях. |
Example-based machine translation systems are trained from bilingual parallel corpora containing sentence pairs like the example shown in the table above. | Пример двуязычного корпуса Системы машинного перевода на основе примеров состоят из двуязычных параллельных корпусов, содержащих пары предложений, как пример, приведённый в таблице выше. |
Unlike on-line searchable corpora, which due to copyright restrictions allow access only to individual sentences, the entire ANC is available to enable research involving, for example, development of statistical language models and full-text linguistic annotation. | В отличие от онлайновых корпусов текстов, которые из-за ограничений, обусловленных авторским правом, предоставляют доступ только к отдельным предложениям, весь корпус текстов ANC доступен для проведения исследований, включая разработку статистических языковых моделей и полнотекстовых лингвистических аннотаций. |
Alignments of parallel corpora at sentence level are prerequisite for many areas of linguistic research. | Выравнивание параллельного корпуса на уровне предложений является необходимой предпосылкой для различных аспектов лингвистических исследований. |
Other approaches to machine translation, including statistical machine translation, also use bilingual corpora to learn the process of translation. | Другие подходы к машинному переводу, включая статистический машинный перевод, также используют двуязычные корпуса для изучения процесса перевода. |
Currently the interface of GICR is in beta stage, so access to the search in the corpora is provided and is free, but is available for researchers on request. | В настоящее время интерфейс корпуса находится в стадии бета-тестирования, поэтому доступ к поиску по корпусу предоставляется и является бесплатным, однако предоставляется по заявке. |
Example-based machine translation systems are trained from bilingual parallel corpora containing sentence pairs like the example shown in the table above. | Пример двуязычного корпуса Системы машинного перевода на основе примеров состоят из двуязычных параллельных корпусов, содержащих пары предложений, как пример, приведённый в таблице выше. |
Also, because the initial target use of the corpora was the development of statistical language models, the full data and all annotations are available, thus differing from the Corpus of Contemporary American English (COCA) which is available only selectively through a web browser. | Кроме того, поскольку первоначальное целевое назначение ANC - разработка статистических моделей языка, пользователям ANC доступны полные данные и все аннотации, в отличие от Корпуса современного американского английского языка (COCA), чьи тексты доступны только выборочно через веб-браузер. |
Large collections of parallel texts are called parallel corpora (see text corpus). | Большие собрания параллельных текстов называются «параллельным корпусом» (англ. parallel corpora). |
Statistical machine translation (SMT) is a machine translation paradigm where translations are generated on the basis of statistical models whose parameters are derived from the analysis of bilingual text corpora. | Статистический машинный перевод (англ. Statistical machine translation - SMT) - разновидность машинного перевода, где перевод генерируется на основе статистических моделей, параметры которых являются производными от анализа двуязычных корпусов текста (text corpora). |
The German Reference Corpus is often referred to by other names, such as Mannheim corpora, IDS corpora, COSMAS corpora and the corresponding German translations. | Мангеймский корпус немецкого языка имеет несколько альтернативных названий, таких как German Reference Corpus, IDS corpora, COSMAS corpora. |