The German Reference Corpus is often referred to by other names, such as Mannheim corpora, IDS corpora, COSMAS corpora and the corresponding German translations. |
Мангеймский корпус немецкого языка имеет несколько альтернативных названий, таких как German Reference Corpus, IDS corpora, COSMAS corpora. |
In the 1990s, he directed a project to make a Japanese parsed corpus, which is now called Kyoto University Text Corpus. |
В 1990-х годах, он руководил проектом создания сегментированного корпуса (parsed corpus) для японского языка, который сейчас известен как Корпус текстов Киотского Университета. |
The American National Corpus (ANC) is a text corpus of American English containing 22 million words of written and spoken data produced since 1990. |
Национальный корпус американского английского (англ. American National Corpus, ANC) - корпус текстов американского английского языка, содержащий 22 миллиона слов из письменных и устных источников, вышедших с 1990 года. |
In contrast to other well-known corpora and corpus archives (such as the British National Corpus), however, the German Reference Corpus is explicitly not designed as a balanced corpus: The distribution of DeReKo texts across time or text types does not match some predefined percentages. |
В отличие от других известных корпусов (таких как, например, Британский национальный корпус), DeReKo нацелен на охват максимально возможного объёма текстов, а не на сбалансированность их состава: распределение текстов по времени создания или по типу текста не соответствует заранее заданным процентным соотношениям. |
This corpus was created by crawling the online news articles from the Hamshahri's website and processing the HTML pages to create a standard text corpus for modern Information Retrieval experiments. |
Корпус Хамшахри был создан путем сканирования новостных статей с веб-сайта газеты «Хамшахри» и последующей обработки HTML-страниц для создания стандартного текстового корпуса, пригодного для стандартного поиска информации. |
The process repeats, each new classifier being trained on a successively larger training corpus, until the whole corpus is consumed, or until a given maximum number of iterations is reached. |
Процесс итеративно повторяется: каждый следующий классификатор обучается на соответствующем ему бо́льшем множестве контекстов - и повторяется до тех пор, пока весь корпус не покрыт либо пока не достигнуто максимальное количество итераций. |
Corpus of Written Tatar (Tatar Corpus) is an electronic corpus of the Tatar language, which has been made available online. |
Пи́сьменный ко́рпус тата́рского языка́ - электронный корпус татарского языка, доступный для онлайн пользования. |
The corpus is available in several formats for download: Tagged Text: 560 MB In SQL Server 2000 Tables: 712 MB The second release of Hamshahri Corpus was launched on 20 October 2008. |
Корпус доступен в нескольких форматах для загрузки: текст с тегами: 560 МБ В таблицах SQL Server 2000: 712 МБ. |