Funkcje analizy plików – Internal fuzzy (Trados Studio) i homogeneity (memoQ)

Nowy plik do tłumaczenia, pusta pamięć tłumaczeń, a tymczasem analiza pokazuje fuzzy match’e. Jak to możliwe?

Poniżej postaram się pokrótce wyjaśnić jak działa analiza CAT i opcje Internal fuzzy i homogeneity.

Zacznijmy od podstaw.

  • Przykład 1

Wyobraźmy sobie analizę tego prostego tekstu:

(1) Ala ma kota.

(2) Ala ma kota.

(3) Ala ma kota.

Analiza pokaże 1 segment no match (1) i 2 segmenty repetitions (2) (3). Pierwszy segment tłumaczymy od nowa, a kolejne dwa nam się same wstawią poprze autopropagację. Pamięć w momencie wykonywania analizy jest pusta, więc nie będzie żadnych innych podpowiedzi.

[images picture_size=”fixed” lightbox=”yes” class=”” id=””]
[image link=”” linktarget=”_self” image=”https://cattools.pl/wp-content/uploads/2014/11/memoq-analiza-1.png” alt=””]
[image link=”” linktarget=”_self” image=”https://cattools.pl/wp-content/uploads/2014/11/trados-studio-analiza-1.png” alt=””]
[/images]

  • Przykład 2

(1) Ala ma kota, psa i rybki.

(2) Ala ma kota i rybki.

(3) Ala ma kota, psa i rybki.

Analiza pokaże 2 segmenty no match (1) (2) i 1 segment repetitions (3). Pamięć jest pusta, więc nie ma podpowiedzi, więc tłumaczymy pierwszy segment, później drugi, a trzeci się rozpropaguje.

[images picture_size=”auto” lightbox=”yes” class=”” id=””]
[image link=”” linktarget=”_self” image=”https://cattools.pl/wp-content/uploads/2014/11/memoq-analiza-2.png” alt=””]
[image link=”” linktarget=”_self” image=”https://cattools.pl/wp-content/uploads/2014/11/trados-studio-analiza-2.png” alt=””]
[/images]

Pojawia się jednak pytanie, czy jest to cała prawda?

  • Przykład 3

Podczas tłumaczenia tekstu zapełniamy pamięć tłumaczeń. Oznacza to, że w tym przypadku, po przetłumaczeniu segmentu (1), w (2) otrzymamy podpowiedź. Nie będzie to zgodność 100%, ale jednak podobny segment (fuzzy), który będziemy mogli wykorzystać. Standardowa analiza nie ujawni nam takich przypadków. Wyniki analizy zmienią się w momencie użycia funkcji Report internal fuzzy match leverage (w Tradosie Studio) i po zaznaczeniu Homogeneity (memoQ).

(1) Ala ma kota, psa i rybki.

(2) Ala ma kota i rybki.

(3) Ala ma kota, psa i rybki.

Analiza wykaże odpowiednio 1 segment no match (1), 1 segment repetitions(3) i 1 segment fuzzy match (2).

[images picture_size=”auto” lightbox=”yes” class=”” id=””]
[image link=”” linktarget=”_self” image=”https://cattools.pl/wp-content/uploads/2014/11/memoq-analiza-3.png” alt=””]
[image link=”” linktarget=”_self” image=”https://cattools.pl/wp-content/uploads/2014/11/trados-studio-analiza-4-internal-fuzzy.png” alt=””]
[/images]

Ten rodzaj analizy będzie bardziej miarodajny, gdy chcemy sprawdzić jak bardzo zyskamy na czasie tłumacząc konkretny tekst.

Jak je włączyć?

  • SDL Trados Studio – Report internal fuzzy match leverage

Podczas wykonywania analizy – Batch tasks -> Analyze files (naciśnij Next), zmień ustawienia w opcjach „Analyze files”

  • memoQ – Homogeneity

Wejdź w statistics i zaznacz opcję Homogeneity.

[images picture_size=”auto” lightbox=”yes” class=”” id=””]
[image link=”” linktarget=”_self” image=”https://cattools.pl/wp-content/uploads/2014/11/memoq-analiza-4-homogeneity.png” alt=””]
[image link=”” linktarget=”_self” image=”https://cattools.pl/wp-content/uploads/2014/11/trados-studio-analiza-4-internal-fuzzy.png” alt=””]
[/images]

Jeżeli kogoś zastanowiła różnica w liczbie znaków między analizami SDL Trados Studio i memoQ wyjaśniam – w memoQ zaznaczona była opcja włączania spacji do wyniku.

Tworzenie pamięci tłumaczeń – alignment, align

 

Alignment to proces tworzenia pamięci tłumaczeń z uprzednio przetłumaczonych tekstów. Pomaga to tłumaczom zaoszczędzić czas, a firmom zlecającym tłumaczenia ? pieniądze.

alignment,align,memoQ

Główne zadanie alignu tekstu z jego tłumaczeniem na inny język polega na wskazaniu fragmentów tekstu źródłowego odpowiadających tłumaczeniom w tekście docelowym. Rezultat tego procesu przedstawiany jest w formie tabelki, bądź listy par segmentów ? słów, zdań, paragrafów, lub ich fragmentów ? skomponowanych z zawartości obydwu tekstów. Czytaj dalej Tworzenie pamięci tłumaczeń – alignment, align

Recenzja programu SDL Trados Studio 2009 (3/6)

Mnogość formatów rozpoznawanych przez Tradosa... czyżby?
Mnogość formatów rozpoznawanych przez Tradosa… czyżby?

W ciągu kilku następnych dni mogłem już poznać Tradosa przy pracy nad rzeczywistym projektem ? lokalizacją jednej z gier tłumaczonych przez mój zespół. Od kolegi nadzorującego projekt otrzymałem plik .tmx z bazą tłumaczeniową stworzoną w starym Tradosie, którą zaimportowałem bez większych problemów. Plik zasadniczy był w formacie Excela, z którego wyciąłem potrzebne mi kolumny, a następnie utworzyłem nowy plik Excela 2007 i zaimportowałem go w Studio. Trzeba w tym miejscu odnotować bardzo wygodną funkcję Studio 2009 o nazwie ?Task Sequences?, czyli zautomatyzowane sekwencje operacji związanych z przetwarzaniem plików, ich analizą i wstępnym tłumaczeniem z wykorzystaniem TM ? to bardzo dobry pomysł (podobny choćby do batchy w Photoshopie), który zaoszczędza sporo czasu, zwłaszcza takim użytkownikom jak ja, poznającym dopiero logikę działania programu, ale z pewnością także i tym bardziej doświadczonym.

Nie miałem żadnych trudności  w trakcie tłumaczenia tekstu, podstawowe funkcje i skróty klawiszowe były zbliżone do TagEditora (a raczej SDLX), więc nie musiałem specjalnie przystosowywać się do nowych warunków. Jako że zlecenie miało konkretny, bardzo krótki termin wykonania, nie miałem czasu na analizowanie wszystkich funkcji, korzystałem więc głównie z podpowiedzi TM, konkordancji i funkcji AutoSuggest. Przy okazji ? dla wszystkich, którzy chcą utworzyć słownik AutoSuggest z bazy TM, czeka niespodzianka, jeśli w bazie nie ma przynajmniej 25 tys. segmentów. Na szczęście moja baza była znacznie większa, więc mogłem spokojnie utworzyć plik słownika i cieszyć się z tej bardzo użytecznej funkcji Tradosa. Cały proces tłumaczenia przebiegał bez trudności i uważam to za największą siłę programu ? jego zasadnicza, najważniejsza część, czyli edytor, pod względem wygody użytkowania i niezawodności, spełnia swoją rolę, co jest z pewnością sukcesem producenta.

Następna część – Recenzja Trados Studio 2009 – część 4/6

Poprzednia część – Recenzja Trados Studio 2009 – część 2/6

Narzędzia CAT, CAT Tools, TEnTs – Trados, MemoQ, Wordfast i DejaVu

Trados, MemoQ, Wordfast, Deja Vu - najbardziej popularne narzędzia do wspomagania procesu tłumaczenia
Trados, MemoQ, Wordfast, Deja Vu – najbardziej popularne narzędzia do wspomagania procesu tłumaczenia

Narzędzia CAT, CAT Tools, TEnTs – mimo różnych nazw, gdy mówimy o narzędziach wspomagających proces tłumaczenia, przeważnie mamy na myśli programy takie jak SDL Trados, MemoQ, Wordfast, czy DejaVu X. Są to najbardziej rozbudowane narzędzia – kompletne środowiska w których możemy nie tylko tłumaczyć, ale zadbać o przebieg całego procesu, zaczynając od analizy powtarzalności, przez tłumaczenie z wykorzystaniem pamięci tłumaczeń (Translation Memory) i bazy terminologicznej, na sprawdzeniu QA (Quality Assurance) kończąc.

Czytaj dalej Narzędzia CAT, CAT Tools, TEnTs – Trados, MemoQ, Wordfast i DejaVu

Czym są pamięci tłumaczeń?

Pamięc tłumaczeń
Pamięć tłumaczeń – przykład widoku dwujęzycznego TM

 

Pamięć tłumaczeń, czyli z angielskiego TM (Translation Memory), to podstawa działania każdego narzędzia CAT. W tym artykule opiszemy czym one są, a także do czego konkretnie służą. Opiszemy także korzyści, które wynikają z posiadania TMa.

  • Czym są pamięci tłumaczeń

Pamięci tłumaczeń to, najprościej mówiąc, zbiory par fragmentów tekstu w języku źródłowym i ich tłumaczeń. Fragmenty te to zwykle zdania, lub ich mniejsze elementy, zebrane w formie korpusu dwujęzycznego – nazywane segmentami.

Są dwa sposoby tworzenia pamięci tłumaczeń: podczas tłumaczenia nowych dokumentów lub za pomocą alignmentu. Pierwszy sposób, to umieszczanie kolejnych nowych segmentów w trakcie tłumaczenia z narzędziem CAT. Można też zrobić to na końcu podczas oczyszczania pliku. Drugi, to alignment (przez niektórych nazywany „urównoleglaniem”) archiwalnych dokumentów przy pomocy specjalnego oprogramowania. W tym wypadku program dzieli dokumenty na segmenty i łączy je w pary. W zależności od rodzaju oprogramowania proces ten wymaga mniejszej lub większej ingerencji człowieka

  • Do czego służą pamięci tłumaczeń

Pamięci tłumaczeń są sercem każdego CATa. Narzędzia wspomagające tłumaczenie czerpią z zasobów pamięci tłumaczeń i podpowiadają zgromadzone w nich segmenty. Użytkownik ma także możliwość wyszukiwania kontekstowego TMów (funkcja Concordance CATów) i wyszukiwania tłumaczeń konkretnych fraz.

  • Korzyści

Korzyści płynące z gromadzenia zasobów w formie pamięci tłumaczeń są nie do przecenienia. Tłumacz nie będzie musiał tłumaczyć tych samych treści wielokrotnie – wykorzysta poprzednie tłumaczenie. Doceni na pewno ułatwienie w zachowaniu spójności w tłumaczonych przez siebie tekstach, a także ułatwienie w dostępie do archiwalnych danych. Biura tłumaczeń zauważą realną oszczędność osiągniętą na powtarzalności zlecanych dokumentów (płacą tylko za nowe treści). A klienci? Oni zyskają na jakości tłumaczenia i szybkości realizacji. Często też zapłacą mnie, gdy będę rozliczać się na podstawie logów analiz CAT.

Klasyfikacja narzędzi CAT

W tym artykule postaram się rozwinąć temat narzędzi CAT, uporządkować informacje na ich temat, a także nakreślić rozległość dziedzin, w których są wykorzystywane.

Narzędzia CAT to szeroka kategoria, w której znajdziemy różnego rodzaju oprogramowanie do wspomagania tłumaczenia. W jej skład wchodzą zarówno niewielkie aplikacje używane do liczenia słów w dokumentach, jak i rozbudowane środowiska do tłumaczenia (ang. TEnT ? Translation Environement Tools – zaproponowane przez Josta Zetsche).

Żeby mieć lepszy pogląd na to czym są, wyróżnimy trzy typy:

  • niezależne narzędzia, które posiadają wybrane funkcjonalności służące wspomaganiu tłumaczenia
  • narzędzia, które uzupełniają funkcjonalności innego oprogramowania
  • narzędzia, które zapewniają kompletne, rozbudowane środowisko dla wszystkich operacji wykorzystywanych w procesie tłumaczenia (TEnTs).

Do pierwszego typu, zaliczamy szereg aplikacji służących do takich zadań jak:

  • przeszukiwanie materiałów referencyjnych,
  • zarządzanie terminologią,
  • zarządzanie projektami tłumaczeniowymi,
  • zliczanie słów i znaków w dokumentach do tłumaczenia
  • lokalizacja oprogramowania

Drugi typ, to narzędzia do:

  • ekstrakcji terminologii
  • ekstrakcji tekstu (np. z formatów graficznych)
  • konwersji między formatami i zarządzania pamięciami tłumaczeń
  • alignmentu
  • zapewnienia jakości (Quality assurance)

Ostatni typ, to najbardziej rozbudowane rozwiązania i narzędzia, które stanowią kompletne środowiska do tłumaczenia (TenTs).

Punktem wyjścia do ich stworzenia było „wsparcie” pamięci tłumacza i rozszerzenie jego możliwości dzięki zastosowaniu pamięci tłumaczeń. Pamięć tłumaczeń pozwalała gromadzić wcześniej przetłumaczone teksty i porównywać do nich nowy materiał, dzięki czemu tłumacz nie musi tłumaczyć tych samych treści wielokrotnie.

Obecnie, narzędzia te oferują znacznie więcej. Dwa podstawowe udogodnienia, którymi dysponują to moduł do zarządzania terminologią ? do tworzenia baz terminologicznych i używania ich w tłumaczeniu (sama idea zarządzania terminologią jest w Polsce mało doceniana), a także obsługa skomplikowanych formatów plików ? programy ukrywają i chronią treści, których nie należy tłumaczyć (np. pokazują je w formie tagów).

W kolejnym artykule wnikliwiej zajmę się klasyfikacją właśnie tych rozwiązań.

Które narzędzie CAT?

Producenci narzędzi CAT
Producenci narzędzi CAT

W całej gamie narzędzi CAT znaleźć można szereg rozwiązań różnych dostawców. Narzędzia wspomagające tłumaczenie możemy dzielić ze względu na cenę (w dobie kryzysu to pewnie ważny wyznacznik), funkcje/moduły, czy wygodę użytkowania. Można też przyjąć inny miernik – popularność.
Popularność, to z jednej strony tłumacze – freelancerzy, którzy wybierają najbardziej odpowiadające im narzędzie. Z drugiej strony (często kluczowej) biura tłumaczeń, które na korzystanie z danego CATa się decydują. Ci ostatni mają nie mały wpływ na to, w czym tłumaczą ich poddostawcy, tym samym stanowiąc główny czynnik kształtujący rynek narzędzi CAT.

To odpowiedni moment na krótką zagadkę. Oto ona:
Które narzędzie CAT jest najpopularniejsze?
Chwila namysłu.. i odpowiedź nasuwa się sama. Najbardziej popularne, a przynajmniej uchodzące za takie, narzędzie CAT, to SDL Trados. Pomijając wszystkie inne kwestie (o których na pewno napiszę w odpowienim momencie), popularność i fakt, że Trados jest oprogramowaniem najczęściej używanym przez biura tłumaczeń, to jemu właśnie poświęcimy na łamach tej strony najwięcej uwagi. Nie oznacza to jednak, że nie wspomnimy o konkurencji.
Bynajmniej. Lista konkurentów i pretendentów do przejęcia pozycji lidera na rynku jest długa. Na polskim rynku narzędzi CAT, drugą pozycję w rankungu popularności zajmuje Wordfast. A trzeci..
Z trzecim mam problem. O ile w gronie CATów kilka aplikacji ugrunowało sobie wysoką pozycję, np: Across, Deja Vu, czy Transit. To pojawiają się nowe programy, takie jak ostatni hit – MemoQ, które wprowadzają sporo zamieszania na rynku. Warto wspomnieć także o inicjatywach open-source i OmegaT i rozwiązaniach całkowicie webowych, takich jak XTM.
Reasumując. Narzędzi wspomagających tłumaczenie jest sporo. Pokusić się można o stwierdzenie, że każdy może wybrać coś dla siebie. To stwierdzenie to jednak mit. Tłumacze dostosowują się do wymagań pracodawców i stosują takie rozwiązania, które dadzą im stałe dochody. Wybór ogranicza się zatem do tych narzędzi CAT, które potrafią obsłużyć najpopularniejsze formaty, są najbardziej uniwersalne, stabilne i przy tym – popularne.

Czym są narzędzia CAT?

Narzędzia CAT, CAT tools - większe tempo, lepsza jakość, mniejsze koszty.
Narzędzia CAT, CAT tools – większe tempo, lepsza jakość, mniejsze koszty.

CAT Tools, narzędzia CAT, a może narzędzia wspomagające proces tłumaczenia. Słyszałeś gdzieś to słowo. Wiele osób o tym mówi, i wiele już z tego korzysta. Tylko w zasadzie, to nie wiesz dokładnie o co chodzi.

W tym artykule postaramy się przybliżyć Ci ten temat. Zajmiemy się wyjaśnieniem trzech kwestii:

  • czym są narzędzia typu CAT
  • do czego służą
  • jak działają
  • komu są potrzebne

Czytaj dalej Czym są narzędzia CAT?