ПредишенСледващото

Паралелно корпус от текстове

Лингвист Дмитрий Dobrovolsky на корпусната лингвистика, трудности превод и принципите на организацията на различни сгради

Искам да разбера какво е, как те работят и на кого и защо те са необходими. Това са трите въпроса, аз се опитам да отговоря. Паралелна случай - е двуезичен корпус, който е оригиналният текст и неговия превод на друг език, и тези два текста не просто лежат един до друг, и трябва да бъдат приведени в съответствие: някои фрагменти от оригинала, трябва да са еднакви със съответните фрагменти превод. Тя позволява да се използват паралелно корпуса като изследователски инструмент.

В допълнение, в корпус подредени паралелно трябва да е маркировка. Има различни видове маркиране: метатекст, граматични и семантични. Това са различни маркери, които са възложени на отделни думи или целия текст като цяло. Какви са те за? Ако текстът не е маркиран в мен, не мога да търсите всякакви граматични форми. Например, аз не мога да попитам всички пасивната причастие в множествено число, като че ли аз текст маркирани, ако има съответните етикети, като задача е възможно, и аз може да реши някои изследвания задача: да изглежда като една или друга граматическа форма преведени на друг език. Семантичната маркиране - тя също е много интересно нещо. Например, аз питам да ми даде всички контексти, в които има обозначение на дрехата. "Jacket", "риза", "панталони" - те вероятно едва ли е необходимо, защото ние вече знаем как да се преведат тези думи на други езици, но "жакет", "е палто", "палтото си", "герб "- да намерите всички думи и да видим как различните преводачи работят в различен контекст, това е много интересно за тях, особено след като тези думи не са в речника намери.

Друг паралел корпус за да помогне в изучаването на т.нар lingvospetsifichnoy лексикон, т.е. думите, които нямат добър еквивалент на други езици. Преди това, основната част от lingvospetsifichnogo език е интуитивен: изследовател представял, че тук, в тази дума има нещо изначално руски или роден английски език. И сега тя може да се настрои с помощта на случая: ако една дума през цялото време преведени по различни начини и той не разполага с еквивалент на нормален, това означава, че е вероятно да lingvospetsifichno.

И по интересен начин, така lingvospetsifichnym българска дума е "затънтено". Немски изглежда да има много подобни думи, използвани в превод, като Einöde или Kaff, но това не е едно и също. Einöde подсказва, че няма нищо и никой, това е празен. А Kaff - това е някакъв малък град, където скучно и лоши. Но затънтено място - това не е задължително да е малък град, там е съвсем друг въпрос, който е далеч от центъра на града, и, както изглежда, той наистина е свързано с културата. Това означава, че в немската култура не е толкова важно да живеят в близост до столицата, защото всички културни центрове там и на други места. Руският космически, както изглежда, е била първоначално така разположени, че идеята за отдалеченост от центъра lexicalized, а думата "boondocks", това е за него.

И последното нещо, което исках да кажа, паралелни корпус на нашата програма "Национален орган на българския език" включва не само немски, аз говорех за днес, или на английски език. Паралелни корпуси много. Имаме френски, испански, италиански, полски, belobolgarsky, украински, латвийски, арменски, има дори многоезичен тяло, когато един или друг текст се сравнява с няколко от неговите преводи на различни езици. И всичко това може да се използва, всичко е безплатно и лесно достъпни онлайн.

Паралелно корпус от текстове

Свързани статии

Подкрепете проекта - споделете линка, благодаря!