Narzędzia CAT – Programy CAT

18 maja, 2015

memoQ 2015 – część 2 – MatchPatch

Przed Wami druga część artykułu opisującego nowości w memoQ 2015.

W memoQ 2015 rozwinięty został mechanizm podpowiadania.

Obok obecnie istniejących mechanizmów, czyli:

LSC Lookup (Longest Substring Concordance – automatyczna konkordancja)
Fragment Assembly (wklejanie znalezionych terminów i fraz do tekstu docelowego)

pojawiła się funkcja Match Patch.

Na czym to polega? Zobaczmy przykład.

Załóżmy, że tłumaczymy następujący tekst:

Wymagane pola to: czas, miasto, data, login, hasło.

Wpisz czas i kliknij OK.

Wpisz miasto i kliknij OK.

Tłumacząc pierwszy segment, dodajemy również terminy do bazy terminolgicznej (w tym czas i miasto).

Wymagane pola to: czas, miasto, data, name.	Required fields: time, city, date, nazwa.
Wpisz czas i kliknij OK.	Enter time and click OK.
Wpisz miasto i kliknij OK.	Enter time and click OK. [standard 65% match]
Wpisz miasto i kliknij OK.	Enter city and click OK. [MatchPatch !94% match]

Podsumowując: memoQ 2015 potrafi poprawić podpowiedź, w której różnica polega na zmianie terminu. Warunkiem jest to, że zarówno termin zmieniany, jak i nowy musi znajdować się w bazie terminologicznej.

Podpowiedzi „poprawiane” przez Match Patch mają podwyższony procent dopasowania, maksymalnie 94% (czyli zawsze poniżej poziomu „good match”) i oznaczone są wykrzyknikiem.

Wprowadzono także dodatkowe ustawienia do nowej funkcji, dzięki którym możemy decydować o tym, w jaki sposób ma działać. Np. wybieramy, czy interesują nas obie podpowiedzi – „przed Match Patch i po”, czy tylko wersja „po”.

Interesującym rozwinięciem tej funkcji jest jej połączenie nie tylko z wynikami z Term Base (z bazy terminologicznej), ale także z mechanizmem LSC Lookup. Efekt jest następujący.

W dalszej części tego samego przykładu tłumaczymy:

hasło	password
Wpisz hasło i kliknij OK.	Enter password and click OK. [MatchPatch !94% match]

„hasło” było osobnym segmentem, który przetłumaczyliśmy i zatwierdziliśmy. Mechanizm LSC wyszukał je i zaproponował jako podpowiedź. Match Patch był w stanie wykorzystać to tłumaczenie do zmodyfikowania swojej propozycji.

Uwaga! W wersji beta występują jeszcze problemy z podstawianiem przez MatchPatch polskich terminów w odmianach (oczywiście odpowiednio dodanych do TB), ale mam nadzieję, że zostanie to poprawione niebawem.

memoQ 2015 – Część 1 – Dashboard

15 maja, 2015

memoQ 2015 – część 1 – Dashboard

Start sprzedaży memoQ 2015 nastąpi już 22 maja 2015 r.

Nowa wersja memoQ przechodzi właśnie ostatnią fazę testów i wkrótce będzie gotowa do premiery.

Co nowego znajdziemy w memoQ 2015. Poniżej przedstawimy najważniejsze funkcje i nowości.

Nowy ekran startowy – Dashboard.

Wiele usprawnień znajdziemy tuż po uruchomieniu programu, na ekranie startowym.

Zmiany ukierunkowane są na ułatwienie zakładania nowych projektów. Warto zwrócić uwagę na trzy obszary i funkcje:

Nowe okno drag’n’drop, do szybkiego dodawania plików i tworzenia projektów

Przeciągnij pliki do tłumaczenia (można przeciągać całe foldery) i rozpocznij konfigurowanie projektu.

memoQ automatycznie wykryje język źródłowy dokumentów i zaproponuje nazwę projektu. Dołącz pamięć tłumaczeń i bazę terminologiczną i gotowe.

Predefiniowane szablony projektów

Szablony projektów są obecne w memoQ od dwóch poprzednich wersji. W memoQ 2015 twórcy wyszli naprzeciw mniej zaawansowanym użytkownikom programu i przygotowali dla nich dwa podstawowe szablony. Znajdziemy je w wyeksponowanym miejscu na wstążce ekranu głównego, są to:

szablon z jedną pamięcią tłumaczeń i bazą terminologiczną na daną kombinację językową, a także
szablon z jedną pamięcią tłumaczeń i bazą terminologiczną na klienta.

Oczywiście nadal można tworzyć własne szablony i dodawać je do okna szybkiego uruchamiania.

Menu kontekstowe

memoQ dodaje także opcję do menu kontekstowego, dostępnego pod prawym przyciskiem myszy, gdy klikniemy na pliku. Dzięki niemu, możemy z folderu przejść bezpośrednio do konfigurowania projektu w memoQ. Wcześniej funkcja ta była dostępna z poziomu „Wyślij do”.

Co jeszcze nowego na ekranie startowym?

Zmieniono prezentację listy projektów i rozbudowano funkcje filtrowanie projektów, które do tej pory dostępne były po przełączeniu widoku w tryb „project manager view”.

Teraz będziemy mogli wybrać między listą jedno- lub dwuwierszową. W pierwszym przypadku możemy dowolnie decydować, które kolumny mają być widoczne

w drugim, możemy skorzystać z kilku skrótów, które pojawiają się po najechaniu na konkretną pozycję na liście.

Nowy filtr zastępuje, stare rozwiązanie z „project manager view”, czyli listy rozwijane i wprowadza kilka udogodnień.

W prosty sposób można zawężać listę wyświetlanych projektów np. do najnowszych.

Można też precyzyjnie filtrować tę listę

Można też definiować bardziej złożone warunki filtra

W kolejnych częściach:

Match patch i usprawnienia w mechanizmach podpowiadania
Zmiany w wersji PM i w projektach serwerowych.

16 maja, 2011

memoQ – jeszcze program CAT, czy już religia?

Do niedawna, kiedy mówiło się o programach CAT, praktycznie każdy miał na myśli Tradosa. Owszem, zdarzały się także osoby pracujące z Wordfastem lub DejaVu, czy innymi nie tyle gorszymi, co mniej popularnymi programami.

Co się zmieniło? Co sprawiło, że obecnie w gronie najlepszych programów CAT wymienia się także nazwę memoQ?

Czytaj dalej memoQ – jeszcze program CAT, czy już religia?

22 lutego, 2011

OCR – sposób na tłumaczenie plików PDF

OCR (ang. Optical Character Recognition, czyli Optyczne Rozpoznawanie Znaków) to technologia umożliwiająca komputerowi czytanie pisma. Programy OCR umożliwiają komputerowi odczytywanie dokumentu, który oryginalnie jest w formie pliku graficznego i przetworzenie go na plik komputerowy, który można edytować, wysyłać, lub drukować.

W technologii OCR można wyróżnić ICR (ang. Image Character Recognition). ICR używany jest przy przenoszeniu na komputer dokumentów pisanych ręcznie, jak np. ręcznie wypełnianych formularzy. Możliwości programów ICR ograniczają się do odczytywania ręcznie pisanych cyfr i drukowanych liter. Ponieważ są one zwykle wpisywane w oddzielne pola na formularzach, daje to programowi możliwość ich odczytania.

Po zeskanowaniu dokumentu należy ustalić obraz. Polega to na zróżnicowaniu kontrastu między punktami, z których składa się obraz. W ten sposób program tworzy zarys znaków. Im większa rozdzielność dokumentu, tym lepiej. Następny etap to rozpoznawanie znaków. Program zaznacza wszystko, co jest znakiem, omijając np. ilustracje. Następnie program identyfikuje znaki i porównuje wyniki z danymi na temat fontów (pochyłe, ozdobne, pogrubione, szeryfowe, bezszeryfowe). Dalej program odczytuje całe słowa i porównuje z słowami zapisanymi w słowniku danego języka. Potem kolej na korektę. W zależności od wersji programu korektą zajmuje albo użytkownik, albo sam program. Ostatnim etapem jest zapisanie odczytanego dokumentu jako plik komputerowy (np. jako dokument Worda).

Aby można było używać OCR, wystarczy mieć oprogramowanie OCR oraz skaner o rozdzielczości 300 dpi. OCR jest szczególnie przydatne, gdy trzeba przenieść do komputera ogromne ilości tekstu. Zamiast przepisywać każdą stronę po kolei, wystarczy zeskanować potrzebne dokumenty i użyć oprogramowania OCR do przetworzenia informacji (tekst, ilustracje, tabele, grafiki, wykresy). Przetworzenie jednej strony zajmuje programowi jedną minutę, co jest nieosiągalnym wynikiem dla człowieka przepisującego ręcznie. Co więcej, niemożliwe jest ręczne przeniesienie graficznych elementów tekstu takich jak ilustracje.

Autorka tekstu: Karolina Tkaczyk

22 lutego, 2011

TMX – format wymiany pamięci tłumaczeń

TMX (ang. Translation Memory eXchange) to standardowy format XML służący do wymiany zasobów pamięci tłumaczeniowych między różnymi programami typu CAT (Computer Aided Translation). Jest to najpopularniejszy format pliku pamięci tłumaczeniowej, obsługiwany przez wiele narzędzi typu CAT. Jego głównym celem jest ułatwienie wymiany danych z pamięci tłumaczeniowych bez większej, lub żadnej straty tych danych w trakcie procesu tłumaczenia.

Computer Aided Translation korzysta z formatu Translation Memory eXchange, gdyż często podczas tłumaczenia występuje potrzeba migracji (wyeksportowania lub zaimportowania) danych z pamięci tłumaczeń do różnych narzędzi CAT. Tłumacz ma prawo do wyboru dowolnego oprogramowania CAT, a w przypadku gdy grupa tłumaczy pracuje nad jednym projektem mogą przy pomocy formatu TMX dzielić się zasobami pamięci tłumaczeń. Wiele narzędzi CAT używa własnych (zastrzeżonych) formatów pamięci tłumaczeń, a ponieważ TMX jest formatem ustandaryzowanym ułatwia wymianę danych pomiędzy różnymi aplikacjami. Możliwe jest wyeksportowanie danych pamięci tłumaczeń z zastrzeżonych aplikacji CAT (np. Trados) do formatu TMX, a następnie importowanie formatu TMX do innego narzędzia CAT.

Format TMX został opracowany w 1998 roku przez stowarzyszenie LISA (Localisation Industry Standards Association), wiodące forum międzynarodowe dla firm działających na rynku globalnym, określające otwarte standardy dotyczące tłumaczeń i lokalizacji oraz obsługi i wsparcia klientów, produktów i usług świadczonych na całym świecie. TMX jest zgodny z XML (Extensible Markup Language, w wolnym tłumaczeniu rozszerzalny język znaczników). Jest to uniwersalny język formalny przeznaczony do reprezentowania różnych danych w strukturalizowany sposób. TMX wykorzystuje także różne standardy ISO takie jak data/czas, kod językowy, kod państwa.

Niewątpliwą zaletą formatu TMX jest to, iż może on działać z praktycznie każdą aplikacją tłumaczeniową. Tłumacz nie jest zatem ściśle związany z jednym konkretnym narzędziem CAT; nawet gdy CAT na którym dotychczas pracował zniknie z rynku, możliwe jest przeniesienie pamięci tłumaczeń do innego narzędzia właśnie dzięki formatowi TMX.

Obecnie TMX dostępny jest w wersji 1.4b, która została opublikowana w październiku 2004 roku. Trwają prace nad wersją 2.0.

Autorka tekstu: Anna Zając

18 lutego, 2011

Początki narzędzi CAT

Tłumaczenie wspomagane komputerowo to proces, w którym człowiek tłumaczy tekst wykorzystując systemy komputerowe jako pomoc automatyzującą, ułatwiającą oraz w znacznym stopniu przyspieszającą prace, które w innym wypadku człowiek musiałby wykonywać samodzielnie.

Pierwsze nieśmiałe próby automatyzacji tłumaczenia miały miejsce już w XVII wieku, kiedy to niemiecki mnich, Johannes Becher, przedstawił matematyczny język opisu zdań w dowolnym języku. Składał się on z równań matematycznych, których znaczenie było takie samo w każdym języku. Jednak na realne próby stworzenia oprogramowania służącego do tłumaczenia wspomaganego komputerowo przyszło nam czekać do drugiej połowy XX wieku, co wiązane było z szybką komputeryzacją. Mimo iż powstało wtedy kilka systemów tłumaczenia, np. Mark II stworzony wspólnie przez IBM oraz Uniwersytet Washington, jakość tłumaczeń była bardzo niska, co zadowalało jedynie odbiorców zainteresowanych tylko szybkością, a nie jakością tłumaczenia.

Czytaj dalej Początki narzędzi CAT

18 lutego, 2011

Tworzenie pamięci tłumaczeń – alignment, align

Alignment to proces tworzenia pamięci tłumaczeń z uprzednio przetłumaczonych tekstów. Pomaga to tłumaczom zaoszczędzić czas, a firmom zlecającym tłumaczenia ? pieniądze.

Główne zadanie alignu tekstu z jego tłumaczeniem na inny język polega na wskazaniu fragmentów tekstu źródłowego odpowiadających tłumaczeniom w tekście docelowym. Rezultat tego procesu przedstawiany jest w formie tabelki, bądź listy par segmentów ? słów, zdań, paragrafów, lub ich fragmentów ? skomponowanych z zawartości obydwu tekstów. Czytaj dalej Tworzenie pamięci tłumaczeń – alignment, align

15 lutego, 2011

Recenzja programu SDL Trados Studio 2009 (1/6)

SDL Trados Studio 2009

autor recenzji: Piotr Leszczyński

Trados to, jak wiadomo, jedna z największych sław wśród CAT-ów, rozwijana od kilkunastu lat i z roku na rok powiększająca grono zarówno swoich zwolenników, jak i wrogów. Do popularności Tradosa przyczyniło się wiele rzeczy, min. obsługa wielu formatów tekstowych i rosnąca renoma, jaka zachęca biura tłumaczeniowe do kupowania komercyjnych wersji tej aplikacji – ale to nie o tym chciałbym pisać. Jako świeży użytkownik nowego Tradosa Studio 2009, chciałem podzielić się pierwszymi wrażeniami z pracy w tym programie, bez nadmiernej ilości porównań do poprzednich wersji tego produktu i dywagacji na temat rangi dziejowej Tradosa na rynku tłumaczeniowym, choćby z tej racji, że nie mam na tym polu zbyt wielu doświadczeń.

Z CAT-ami zetknąłem się po raz pierwszy parę lat temu przy okazji współpracy z zespołem lokalizującym oprogramowanie, przy czym korzystałem wtedy z programów open-source, jak poEdit czy KBabel albo z programów wspomagających tłumaczenie dostarczanych przez klientów. Programy te, z wszystkimi ich wadami i zaletami, nauczyły mnie podstaw tego rodzaju pracy z tekstem, stąd zanim zdecydowałem się na Tradosa, wiedziałem już dość dobrze jak CAT-y mogą przysłużyć się w pracy tłumacza, oraz że są wręcz niezbędne dla każdego szanującego się lokalizatora oprogramowania. Z czasem instalowałem na swoim komputerze darmowe wersje min. Tradosa, Wordfasta i DejaVu dla porównania podstawowej funkcjonalności czołowych komercyjnych aplikacji tego typu i wiedziałem już, że będę musiał w końcu zdecydować się na pełną wersję jednego z profesjonalnych CAT-ów. Tak się złożyło, że w ostatnim czasie miałem okazję uczestniczyć w kursie obsługi Tradosa na mojej uczelni oraz nawiązania współpracy z zespołem tłumaczeniowym zajmującym się głównie lokalizacją gier komputerowych. Dowiedziałem się też, że w moim nowym zespole Trados jest narzędziem dosyć często wykorzystywanym – stąd też mój wybór niejako musiał paść na ten program ? a ja stałem się w ten sposób typowym, statystycznym wręcz przykładem użytkownika CAT-a, którego wybór w tej kwestii był w dużej mierze wyborem pracodawcy. Czy okazał także dobry wyborem ze względu na komfort mojej pracy, o tym napiszę w dalszej części recenzji. Przejdźmy zatem do moich pierwszych wrażeń związanych z pracą w Tradosie Studio 2009.

Recenzja SDL Trados Studio – część 2/6

14 lutego, 2011

Recenzja programu SDL Trados Studio 2009 (2/6)

Trados w praniu

Zacznijmy od początku, a więc od instalacji. Trados sprawił mi już na tym etapie niemiłą niespodziankę ? okazało się, że muszę zainstalować Studio 2009 na partycji systemowej i nie przewidziano w instalatorze żadnej możliwości zmiany lokalizacji katalogu (w przeciwieństwie do pozostałych elementów pakietu, jak MultiTerm). Jako relatywnie świadomy użytkownik Windowsów instaluję wszelkie aplikacje na osobnej partycji, partycję systemową przeznaczając wyłącznie na system operacyjny, z myślą o szybkiej defragmentacji albo niezbędnym sformatowaniu tej części dysku, stąd też konieczność instalacji programu na tej właśnie partycji odebrałem jako swoiste lekceważenie mnie przez producenta. Mimo wszystko jest to jednak minus z kategorii niedogodności, a nie wyjątkowo poważna wpadka, więc nie będę rozpisywał się dłużej na ten temat.

Pracę z nowym Tradosem zacząłem od założenia kilku prostych projektów, żeby przyzwyczaić się do odmienionego wyglądu i ogólnej logiki interfejsu nowej odsłony Tradosa. Sam układ graficzny aplikacji i odświeżona stylistyka od razu dała się zauważyć i należy ją zapisać jako jedna z najbardziej udanych zmian, jakich dokonał wydawca Studio 2009. Trzeba jednak pamiętać, że jest to raczej zapożyczenie rozwiązań, które pojawiły się już znacznie wcześniej w innych CAT-ach, niż samorodne nowatorstwo SDL.

Proste, przykładowe projekty z użyciem plików tekstowych i starych plików Worda nie sprawiały problemów, a ogólne wrażenie pracy z Tradosem było całkiem pozytywne i przypominało mi nieco pracę w Deja Vu. Problemy jednak pojawiły się, kiedy zacząłem korzystać z rzeczywistych plików, jakie tłumaczyłem dotąd ręcznie w edytorze tekstu. Na pierwszy ogień poszedł oczywiście plik PDF, a to dlatego, że w materiałach reklamowych SDL nadmieniał o ulepszonym filtrze do tego formatu. Niestety, żaden z plików PDF, jakie chciałem przetłumaczyć nie został skonwertowany w Studio 2009 do formy edytowalnej, żaden nie został oznaczony etykietą ?translatable?. Co prawda filtr posiada sporo opcji konfiguracji, ale nie miałem ogromnej potrzeby korzystania z plików PDF, więc nie sprawdzałem bliżej możliwości filtra firmy Solid. Wystarczyła mi jednak na tym etapie poznawania programu informacja, że tak renomowany produkt jak Trados do dzisiaj, mimo deklarowanych możliwości, nie radzi sobie wciąż z jednymi z najczęściej używanych obecnie formatów dokumentów. Zdaję sobie sprawę, że nie jest to jedyny taki produkt na rynku, ale mimo wszystko jest to jakieś nieporozumienie ? choć wciąż łudzę się, że jest to jedynie kwestia nieodpowiedniej konfiguracji filtra.

Następna część – Recenzja Trados Studio 2009 – część 3/6

Poprzednia część – Recenzja Trados Studio 2009 – część 1/6

13 lutego, 2011

Recenzja programu SDL Trados Studio 2009 (4/6)

Bardzo podoba mi się także koncepcja podzielenia projektu na część tłumaczeniową (Translation), korektorską (Review) i finalną (Sign-off), co, przynajmniej potencjalnie, pomaga menedżerom projektu i poszczególnym członkom zespołu na dobrą organizację procesu tłumaczenia i kontroli jakości, zaś freelancerom na prowadzenie ?wewnętrznego? kilkuetapowego procesu tłumaczenia. Myślę, że SDL powinno dalej iść w tym kierunku i rozszerzyć także część ProjectsView o bardziej zaawansowane funkcje zarządzania projektami, choćby o funkcję wskazującą ilość tekstu przetłumaczonego danego dnia ? dla szacunkowych obliczeń wydajności tłumaczy w przypadku konkretnego projektu.

Po skończeniu projektu, kiedy miałem nieco więcej czasu na przyjrzenie się bliżej opcjom programu, odkryłem parę dodatkowych mankamentów Tradosa. Moduł EditorView ma na przykład problem z podglądem plików Excela i Worda – można co prawda skorzystać z funkcji ?View In?, ale jest to już z mojego punktu widzenia osobny eksport pliku, a nie transparentny podgląd w wygodnym, rozwijanym oknie z miniaturą tekstu (a więc normalna funkcjonalność ?Preview?). Pliki, o jakich mówię, to absolutne standardy, jeśli chodzi o formaty tekstowe i jakiekolwiek problemy z ich obsługą to dowód na niezbyt poważne traktowanie użytkowników przez wydawcę Tradosa.

Innym, dość zaskakującym problemem edytora Studio 2009 jest kwestia scalania (merge) lub rozdzielania (split) segmentów. W trakcie tłumaczenia gry nie zauważyłem tego zupełnie i nie miałem specjalnej potrzeby łączenia bądź dzielenia segmentów, natomiast kiedy parę dni temu dostałem zlecenie przetłumaczenia krótkiego tekstu handlowego, spotkałem się z kłopotami z ich scalaniem. Opcja ?Merge segments? w menu kontekstowym była nieaktywna, mimo zaznaczenia prawidłowo dwóch komórek (patrz: Ilustracja 3).

Następna część – Recenzja Trados Studio 2009 – część 5/6

Poprzednia część – Recenzja Trados Studio 2009 – część 3/6