ASR, TTS, biometria głosowa, wirtualna rzeczywistość

Głównym obszarem działalności Techmo jest wdrażanie biznesowych rozwiązań z zakresu technologii mowy i komputerowego przetwarzania języka naturalnego. Jesteśmy na rynku od 2013 roku. Techmo powstało jako spin-off we współpracy z AGH w Krakowie. Nasz zespół w dużej części składa się z naukowców i specjalistów IT, którzy łączą pasję badawczą z jej praktycznym zastosowaniem w różnych dziedzinach życia. Jesteśmy specjalistami w zakresie analizy dźwięku i mowy, ale też pasjonatami nowoczesnych technologii wykorzystywanych w grach komputerowych.
Mimo akademickiego rodowodu dobrze rozumiemy potrzeby nowoczesnego biznesu. Światem rządzi zmiana. Biznes, aby nadążyć za zmieniającą się rzeczywistością, musi otrzymywać rozwiązania wyprzedzające swoją epokę. Takie właśnie rozwiązania dostarcza Techmo.
Techmo współpracuje z szeregiem instytucji i organizacji pozarządowych, będąc uczestnikiem publicznej debaty nad nowymi wyzwaniami związanymi z mową i jej cyfryzacją. Są to między innymi: Instytut Kościuszki, RWTH Aachen, Hokkaido University, Uniwersytet Medyczny w Białymstoku, Lekta, Ernst & Young, Altar, Pacific Voice and Speech Foundation, Fundacja Siódmy Zmysł.

Techmo ASR (automatic speech recognition) to nowoczesny system stworzony przez Techmo. Wykorzystuje głębokie sieci neuronowe i machine learning. Wspiera automatyzację procesów o dowolnie dużym wolumenie przy zachowaniu najwyższej dokładności i szybkości działania. Autorski silnik został opracowany przez zespół naukowców z AGH w oparciu o wieloletnie badania. Rozpoznaje mowę naturalną, wspiera także gramatyki SRGS. Komunikuje się za pomocą protokołów MRCP oraz gRPC. Wykorzystuje głębokie sieci neuronowe, bazuje na światowych rozwiązaniach z dziedziny machine learning. Dodatkowo jest łatwy do integracji w dowolnym środowisku.

Techmo Pathfinder to system analizy wypowiedzi i rozmów oparty o technologię ASR dla języka polskiego. Pozwala wyszukiwać określone słowa lub frazy kluczowe w czasie rzeczywistym lub w dowolnie dużym zbiorze nagrań.

Precyzyjnie wskazuje rezultaty rozpoznania wraz z ich dokładnym umiejscowieniem (sygnatura czasowa, ID nagrania). Stwierdza również brak zdefiniowanych sformułowań w wypowiedzi. Umożliwia tworzenie złożonych i zróżnicowanych raportów w oparciu o analizę jakościową i ilościową.

System nie wymaga połączenia z siecią, jest instalowany w miejscu i na infrastrukturze wskazanej przez klienta (on-premise). Jest kompatybilny z obecnymi na rynku rozwiązaniami sprzętowymi i obsługuje wszystkie standardowe formaty.

Techmo oferuje wysokiej jakości narzędzie TTS (ang. Text-to-Speech) do syntezy mowy polskiej. Techmo TTS to wydajny i precyzyjny program do zamiany tekstu w mowę. Zastosowane technologie gwarantują wysoką dokładność, naturalność i wydajność syntezy. System jest łatwo adaptowalny dla pełnej palety naturalnych, nowych i indywidualnie dobieranych głosów.

SEZAM to rozwiązanie pozwalające na identyfikację mówcy połączone z możliwością jego weryfikacji i autoryzacji. Podnosi poziom, zwiększa wygodę i jakość obsługi. Działanie systemu jest niezależne od intonacji lub czasowej zmiany barwy głosu, wynikającej z czynników niezależnych (chrypka, temperatura otoczenia etc.). Wystarcza dowolna próbka głosu o długości minimum 1600 milisekund. Dla nagrań powyżej 5 sekund pozwala wykonywać różne zadania związane z mapowaniem mówców.

SoundToolKit to opracowane przez Techmo innowacyjne rozwiązanie, które umożliwia realistyczną symulację zachowania dowolnych dźwięków w środowisku 3D. W symulacji brane są pod uwagę takie elementy jak rozkład budynku, materiał, kubatura, ruch źródła dźwięku czy pozycja słuchacza. Symulacja realizowana jest na bieżąco, uwzględniając dynamicznie zmieniające się warunki otoczenia. System dedykowany jest dla rynku gier wideo, jako narzędzie ułatwiające i przyspieszające pracę deweloperów.

Zespół

Pytania i odpowiedzi Zadaj pytanie Anuluj

Grzegorz

22 września 2016 o 11:52

Jaki jest kontakt do techmo ? Na stronie techmo.pl nie ma emaila ani telefonu …..

Pytanie zostało wysłane. Czekamy na odpowiedź.

22 września 2016