Nauka

Zapiszą, jak mówisz. Z dokładnością do jednej setnej sekundy

Od lewej: dr Marta Śleziak, prof. Monika Zaśko-Zielińska i dr hab. Anna Majewska-Tworek Od lewej: dr Marta Śleziak, prof. Monika Zaśko-Zielińska i dr hab. Anna Majewska-Tworek Fot. Aleksandra Draus
Przy transkrypcji nie pomijamy żadnego zjawiska. Interesują nas momenty ciszy, pauzy, przeciąganie, powtarzanie, korekty. Także śmiech. A nawet kichnięcie.

Program, z którego korzystamy, pozwala też na dokładną analizę interakcji między mówcami: wpadania sobie w słowo czy przerywania współrozmówcy – mówi prof. Monika Zaśko-Zielińska, jedna z trzech – obok dr hab. Anny Majewskiej-Tworek i dr Marty Śleziak – założycielek Pracowni Polszczyzny Mówionej na Uniwersytecie Wrocławskim.

Czym zajmowały się Panie przed założeniem Pracowni Polszczyzny Mówionej? Jak zaczęła się współpraca między Paniami?

Anna Majewska-Tworek: – Miałam szczęście pracować w niemiecko-brytyjsko-polskim projekcie GeWiss, związanym z badaniem języka naukowego w jego mówionej odmianie. Z kolei Monika realizowała indywidualny projekt NCN poświęcony kryminalistycznej analizie dokumentu – badaniom komunikacji nieoficjalnej w listach pożegnalnych oraz ich oralności i piśmienności. Udział w obu projektach wiązał się z poznaniem i wykorzystaniem metod współczesnej humanistyki cyfrowej, które umożliwiają pogłębione badania nad oralnością – także tą, której ślad jest wyraźny w nieoficjalnych tekstach pisanych.

Natomiast doświadczenie Marty Śleziak, wyniesione z polonistyczno-dziennikarskiego projektu „Ocaleni z zatraty”, okazało się cenne na etapie warsztatowego przygotowania do samodzielnego zbierania materiału już w ramach nowo powstałej Pracowni. Posłużyło pogłębieniu wiedzy o specyfice biografii ludzi zamieszkujących region Dolnego Śląska, wyeksponowaniu znaczenia etycznej postawy badacza wobec nagrywanego, poznaniu dziennikarskiego sposobu porządkowania danych mówionych.

prof. Monika Zaśko-ZielińskaFot. Aleksandra Drausprof. Monika Zaśko-Zielińska

Czym dokładnie zajmują się Panie w Pracowni?

A.M.-T.: – Realizujemy kilka różnych, szeroko zakrojonych, projektów. Jest to możliwe, ponieważ pracujemy w zespołach, które tworzą pracownicy, doktoranci oraz studenci z Instytutu Filologii Polskiej i Instytutu Filologii Germańskiej Uniwersytetu Wrocławskiego – osoby zainteresowane mówioną odmianą języka, ludzie pełni pasji i twórczej radości.

Jesteśmy zainteresowane gromadzeniem i starannym archiwizowaniem danych mówionych, a dokładniej: spontanicznych wypowiedzi współczesnych użytkowników polszczyzny. W tym momencie głównie mieszkańców Wrocławia i Dolnego Śląska, ale mamy ambitne plany badań językowego zróżnicowania całego Śląska, rozumianego w jego starych, historycznych granicach. Tu wspiera nas Pracownia Fonetyki, kierowana przez prof. Artura Tworka. Liczymy też na współpracę z innymi ośrodkami naukowymi.

Interesuje nas również badanie specyficznych cech wypowiedzi mówionych. Systematycznie opisujemy funkcje wyrazów typu: „no”, „właśnie”, „jakby”. Okazuje się, że są one różne, jeśli występują w różnych sytuacjach – oficjalnych lub nieoficjalnych. Wyniki takich analiz pomagają chociażby przy uzupełnianiu słowników współczesnego języka polskiego. Jednak żeby prowadzić takie badania, potrzebne są bogate zbiory danych mówionych. Muszą być dobrze opracowane, starannie zarchiwizowane. Potrzebny jest więc odpowiednio duży korpus danych.

Czym są korpusy?

Monika Zaśko-Zielińska: – To zbiory autentycznych tekstów, których zadaniem jest możliwie dokładne odzwierciedlenie sposobu, w jaki faktycznie używamy języka. Powinny być urozmaicone i rozbudowane, dlatego składają się z tekstów o różnorodnych stylach, gatunkach, źródłach czy dziedzinach tematycznych. Wszystkie teksty w korpusach są zdygitalizowane i opatrzone metadanymi, czyli szeregiem dodatkowych informacji, jak autor, tytuł czy rok. Dzięki temu można łatwo wyszukać przykłady zastosowań konkretnych wyrazów, ale także porównywać polszczyznę kobiet i mężczyzn, dzieci i dorosłych czy mieszkańców różnych regionów. Dysproporcja między tekstami mówionymi a pisanymi w istniejących korpusach językowych jest ogromna. Ważne jest, żeby ją zmniejszyć. Na całym świecie widzimy tendencję, żeby gromadzić jak najwięcej materiału mówionego.

dr hab. Anna Majewska-TworekFot. Aleksandra Drausdr hab. Anna Majewska-Tworek

Wyobrażam sobie, jak opracować tekst pisany, żeby mógł trafić do tego typu baz danych, ale Panie zajmują się wypowiedziami ustnymi, rozmowami. W jaki sposób przenosi się je do korpusów językowych?

M.Z.-Z.: – Nagrywamy rozmowę, którą następnie transkrybujemy, czyli zapisujemy w specjalnym programie. Nie pomijamy przy tym żadnego zjawiska. Interesują nas i momenty ciszy w mówieniu, i pauzy typu „yyy”, przeciąganie, powtarzanie, korekty, wyrazy retardacyjne, które pozwalają nam – często zupełnie nieświadomie – zwolnić tempo mówienia. Także śmiech. A nawet kichnięcie. Program, z którego korzystamy, pozwala też na dokładną analizę interakcji między mówcami: wpadania sobie w słowo czy przerywania współrozmówcy.

Nasz mózg filtruje wypowiadane dźwięki? Nie przyswajamy wszystkiego, co wypowiadamy?

M.Z.-Z.: – Filtruje, ale też automatycznie interpretuje. Z naszych doświadczeń jednoznacznie wynika, że gdyby przeciętna osoba miała przetranskrybować nagraną wypowiedź, zapisałaby tak naprawdę swoją interpretację, a nie to, co faktycznie zostało nagrane.

A.M.-T.: – Nie mamy świadomości wszystkich cech występujących w mowie, dopóki nie zostaną one szczegółowo zapisane. Nagrane wypowiedzi zapisujemy z dokładnością do jednej setnej sekundy. Jest to możliwe dzięki zintegrowaniu pliku dźwiękowego z niezwykle dokładną linią czasu. Transkrybowanie jednej minuty nagrania jest czasochłonne, trwa około jednej godziny. Jednak efekt pracy zawsze robi na nas wrażenie. Uzyskane wyniki analizy inspirują do formułowania kolejnych pytań badawczych. To naprawdę fascynujące obserwować staranny zapis wypowiedzi spontanicznej i jednocześnie odsłuchiwać ją.

Nowe technologie stały się początkiem rewolucji w badaniach nad mową?

M.Z-Z.: – Z pewnością są kluczowe dla ich rozwoju. Kiedyś mowa budziła nieufność językoznawców, bo była zbyt ulotnym materiałem do badań. Dziś korzystamy z programów, które dają możliwość odsłuchu dowolnego fragmentu transkrypcji. Kiedy więc badacz chce sprawdzić, w jaki sposób rozmówca coś powiedział, może to zrobić z łatwością. To bardzo ważne, bo bez tego nie da się właściwie badać języka mówionego. Za sprawą rozwoju technologii zaczęła się moda na badanie tekstów mówionych. Dzięki niej swoisty renesans przeżywa dialektologia, czyli nauka badająca regionalne zróżnicowanie języka.

W 2018 roku przypadkiem odnaleziono w Instytucie Filologii Polskiej kasety z nagraniami z lat 80. Podjęły się Panie ich opracowania. Na czym polegał ten projekt?

A.M.-T.: – Okazało się, że zakurzone kasety pochodzą z ważnego w latach 80. projektu „Polszczyzna mówiona mieszkańców miast”, który miał na celu zbadanie, jak mówią mieszkańcy m.in. Krakowa, Łodzi, Katowic i Wrocławia. Do pracy nad transkrypcją zaangażowałyśmy studentów i doktorantów z polonistyki oraz germanistyki. Razem przetranskrybowaliśmy 10 godzin nagrań. To bardzo dużo. To był nasz pierwszy duży projekt i śmiało można powiedzieć, że od razu wskoczyliśmy na głęboką wodę, ponieważ praca nad nagraniami sprzed ponad trzydziestu lat była o tyle trudniejsza, że ich jakość pozostawiała wiele do życzenia. Ale opłaciło się. Nasz materiał jest obecnie najstarszym zbiorem w polskich korpusach mówionych.

Obecnie pracują Panie nad projektem „Biografie językowe Dolnoślązaków” – od jakiej grupy zaczęły Panie badania?

A.M.-T.: – W pierwszym etapie docieraliśmy do mówców powyżej 65 roku życia. W trakcie transkrybowania nagrań w programie ELAN przykuł naszą uwagę sposób mówienia, który wyróżnia osoby późnej dorosłości. Specyficzne cechy mowy seniorów na pewno będą przedmiotem pogłębionych badań w Pracowni Polszczyzny Mówionej. Wyniki mogą być istotne dla specjalistów diagnozujących osoby w podeszłym wieku, np. gerontologopedów. Chcemy przeanalizować polszczyznę mówioną seniorów pod kątem ustalenia normy językowej. Upraszczając: chcemy się dowiedzieć, które zjawiska, czasami nas irytujące, są typowe dla ludzi w starszym wieku. A w związku z tym, prędzej czy później, dotkną nas wszystkich.

Jakie to zjawiska?

A.M.-T.: – Można je porównać do tych, które zdarzają się nam w chwilach stresu lub zmęczenia: kiedy nie możemy znaleźć słowa, czujemy, że mamy je gdzieś na końcu języka, jednak nie potrafimy go sobie przypomnieć. Albo gubimy myśl przewodnią, wprowadzamy wielowątkowość i opowiadamy o szczegółach, które w danym momencie są nieistotne.

M.Z.-Z.: – Zaciekawiło nas to, że z obecnego stanu badań można się dowiedzieć – choć też jeszcze niewiele – o różnego rodzaju zaburzeniach mowy związanych z chorobami, np. neurologicznymi. Natomiast nie ma danych dotyczących języka zdrowo starzejących się osób. Chcemy wypełnić tę lukę i stworzyć bazę danych językowych, która posłuży do kolejnych badań, ale również będzie wsparciem dla logopedów, lekarzy czy psychologów.

Rozmawiała Aleksandra Draus

Korzystaj z nowoczesnych technologii, żeby poznawać tajniki języka. Zostań studentem Uniwersytetu Wrocławskiego.

Polityka 30.2020 (3271) z dnia 21.07.2020; Nauka i cywilizacja; s. 45
Reklama

Codzienny newsletter „Polityki”. Tylko ważne tematy

Na podany adres wysłaliśmy wiadomość potwierdzającą.
By dokończyć proces sprawdź swoją skrzynkę pocztową i kliknij zawarty w niej link.

Informacja o RODO

Polityka RODO

  • Informujemy, że administratorem danych osobowych jest Polityka Sp. z o.o. SKA z siedzibą w Warszawie 02-309, przy ul. Słupeckiej 6. Przetwarzamy Twoje dane w celu wysyłki newslettera (podstawa przetwarzania danych to konieczność przetwarzania danych w celu realizacji umowy).
  • Twoje dane będą przetwarzane do chwili ew. rezygnacji z otrzymywania newslettera, a po tym czasie mogą być przetwarzane przez okres przedawnienia ewentualnych roszczeń.
  • Podanie przez Ciebie danych jest dobrowolne, ale konieczne do tego, żeby zamówić nasz newsletter.
  • Masz prawo do żądania dostępu do swoich danych osobowych, ich sprostowania, usunięcia lub ograniczenia przetwarzania, a także prawo wniesienia sprzeciwu wobec przetwarzania, a także prawo do przenoszenia swoich danych oraz wniesienia skargi do organu nadzorczego.

Czytaj także

Żyjmy Lepiej

Dziesięć tysięcy kroków

Chodźmy chodzić, maszerować z kijami i biegać. Plan minimum to dziesięć tysięcy kroków dziennie. Można też zwiększyć obroty, ale trzeba to robić z głową.

Marcin Piątek
28.07.2020
Reklama