| Reverso Context is an online and mobile application combining big data from large multilingual corpora to allow users to search for translations in context. | Reverso Context - это мобильное и веб-приложение, объединяющее данные из различных многоязычных корпусов с целью поиска перевода в контексте. |
| Example-based machine translation systems are trained from bilingual parallel corpora containing sentence pairs like the example shown in the table above. | Пример двуязычного корпуса Системы машинного перевода на основе примеров состоят из двуязычных параллельных корпусов, содержащих пары предложений, как пример, приведённый в таблице выше. |
| The ANC differs from other corpora of English because it is richly annotated, including different part of speech annotations (Penn tags, CLAWS5 and CLAWS7 tags), shallow parse annotations, and annotations for several types of named entities. | ANC отличается от других корпусов английского языка широкой аннотированностью, включая различные частеречевые разметки (Penn tags, CLAWS5 и CLAWS7 tags), аннотации поверхностного синтаксического анализа и аннотации для нескольких типов именованных объектов. |
| The analysis and processing of various types of corpora are also the subject of much work in computational linguistics, speech recognition and machine translation, where they are often used to create hidden Markov models for part of speech tagging and other purposes. | Анализ и обработка разных типов корпусов являются предметом большинства работ в области компьютерной лингвистики (например, извлечение ключевых слов), распознавания речи и машинного перевода, в которых корпусы часто применяются при создании скрытых марковских моделей для маркирования частей речи и других задач. |
| A special kind of speech corpora are non-native speech databases that contain speech with foreign accent. | Особый вид речевых корпусов - это базы данных текстов, наговоренных людьми, не являющимися носителями языка, которые содержат речь с иностранным акцентом. |
| Alignments of parallel corpora at sentence level are prerequisite for many areas of linguistic research. | Выравнивание параллельного корпуса на уровне предложений является необходимой предпосылкой для различных аспектов лингвистических исследований. |
| Other approaches to machine translation, including statistical machine translation, also use bilingual corpora to learn the process of translation. | Другие подходы к машинному переводу, включая статистический машинный перевод, также используют двуязычные корпуса для изучения процесса перевода. |
| In Speech technology, speech corpora are used, among other things, to create acoustic models (which can then be used with a speech recognition engine). | В речевых технологиях речевые корпуса используются, среди прочего, для создания акустических моделей (которые затем могут использоваться в механизмах распознавания речи). |
| Currently, the ANC includes a range of genres, including emerging genres such as email, tweets, and web data that are not included in earlier corpora such as the British National Corpus. | ANC включает в себя ряд текстов из новых источников, включая такие как электронная почта, твиты и тексты с веб-страниц, которые не включены в более ранние корпуса английского языка, такие как Британский национальный корпус. |
| Also, because the initial target use of the corpora was the development of statistical language models, the full data and all annotations are available, thus differing from the Corpus of Contemporary American English (COCA) which is available only selectively through a web browser. | Кроме того, поскольку первоначальное целевое назначение ANC - разработка статистических моделей языка, пользователям ANC доступны полные данные и все аннотации, в отличие от Корпуса современного американского английского языка (COCA), чьи тексты доступны только выборочно через веб-браузер. |
| Large collections of parallel texts are called parallel corpora (see text corpus). | Большие собрания параллельных текстов называются «параллельным корпусом» (англ. parallel corpora). |
| Statistical machine translation (SMT) is a machine translation paradigm where translations are generated on the basis of statistical models whose parameters are derived from the analysis of bilingual text corpora. | Статистический машинный перевод (англ. Statistical machine translation - SMT) - разновидность машинного перевода, где перевод генерируется на основе статистических моделей, параметры которых являются производными от анализа двуязычных корпусов текста (text corpora). |
| The German Reference Corpus is often referred to by other names, such as Mannheim corpora, IDS corpora, COSMAS corpora and the corresponding German translations. | Мангеймский корпус немецкого языка имеет несколько альтернативных названий, таких как German Reference Corpus, IDS corpora, COSMAS corpora. |