group of people sitting and robotsgroup of people sitting

Twój przewodnik po CLARIN-PL Chat

Jeśli zastanawiasz się, jak skutecznie używać CLARIN-PL Chat, to ten przewodnik jest dla Ciebie. Najpierw jednak powinieneś zrozumieć CLARIN-PL Chat jako koncepcję. Narzędzie to działa zupełnie inaczej niż konwencjonalne wyszukiwarki. Rewolucyjność tej technologii polega na tym, że można ją nauczyć rozumienia niuansów ludzkiego języka.

group of people sitting

Jak działa CLARIN-PL Chat?

CLARIN-PL Chat to rodzaj modelu sztucznej inteligencji (AI), który potrafi zrozumieć i wygenerować tekst podobny do ludzkiego. Jest to w zasadzie polska nakładka na ChatGPT. Modele tego typu są szkolone na dużym zbiorze tekstów z Internetu (w przypadku ChatGPT dane sięgają do 2021 roku). Mogą być wykorzystywane do odpowiadania na pytania, generowania treści pisemnych i wykonywania różnych innych zadań związanych z językiem naturalnym. Najlepiej myśleć o czacie jako o wirtualnym asystencie, któremu możesz zadawać pytania, a on zrobi wszystko, aby dostarczyć Ci odpowiedzi.

ChatGPT, a więc i CLARIN-PL Chat dobrze generuje tekst, ale może powielać dezinformacje lub tworzyć fakty. Dlatego ważne jest, aby sprawdzić informacje otrzymane od czatu i użyć własnego osądu przy ocenie jego odpowiedzi. Przed skorzystaniem z czatu zapoznaj się też z Regulaminem.

Tworzenie zapytań

Aby zapytać czat, w pasku tekstowym podaj swoje pytanie lub instrukcję dla modelu. Możesz też skorzystać z biblioteki predefiniowanych pytań (po lewej stronie strony). Zawsze możesz też doprecyzować zapytanie na kolejnych etapach rozmowy, tak jakbyś rozmawiał z człowiekiem, a model postara się dostosować odpowiedź do Twoich wytycznych. Możesz wprowadzać instrukcje w języku naturalnym w dowolnym języku - czat dokładnie przetworzy Twoje pytanie i postara się udzielić najlepszej odpowiedzi.

Określ swój cel

Zanim zaczniesz rozmawiać z czatem, musisz wiedzieć, co chcesz osiągnąć. Czy chcesz zadać pytanie, uzyskać informacje czy może po prostu porozmawiać? Zadając pytanie, określ też warunki ukończenia zadania.

Używaj języka naturalnego

Staraj się używać naturalnego języka podczas komunikacji tak jak podczas rozmowy z inną osobą.

Bądź cierpliwy

Procesowanie zapytania może być dużo dłuższe, jeśli zapytanie jest skomplikowane lub dużo osób używa czatu na raz.

Zadaj jasne i konkretne pytanie

Zadając pytanie, staraj się być jak najbardziej konkretny i precyzyjny. Model jest szkolony w szerokim zakresie tematów, ale im więcej informacji podasz, tym lepiej model będzie mógł odpowiedzieć. Im bardziej szczegółowe będą Twoje pytania, tym dokładniejsze będą odpowiedzi. Postaraj się też unikać niejednoznaczności - używania dwuznacznego lub otwartego języka, który mógłby doprowadzić do zamieszania lub nieporozumienia.

Bądź zwięzły

Pytania i wypowiedzi powinny być zwięzłe i na temat. Model jest szkolony na dużym zbiorze tekstów, a dłuższe wypowiedzi mogą czasami prowadzić do nieporozumień lub błędnej interpretacji.

Zapewnij kontekst

Jeśli Twoje pytanie jest związane z konkretnym tematem lub sytuacją, podaj kontekst wypowiedzi, aby pomóc modelowi lepiej zrozumieć, czego oczekujesz. Spróbuj przeformułować swoje pytanie lub podać więcej informacji, jeśli nie uzyskasz odpowiedzi, której szukasz. Dodatkowo używanie konkretnych przykładów lub scenariuszy, które odnoszą się do Twojego pytania lub tematu, może pomóc wygenerować bardziej ukierunkowane i odpowiednie odpowiedzi.

Gramatyka i pisownia

Używaj poprawnej gramatyki i pisowni: poprawna gramatyka i pisownia pomagają modelowi lepiej zrozumieć Twoje pytanie i udzielić jaśniejszej odpowiedzi. Pisz wielką pierwszą literą tam, gdzie jest to wymagane, aby pomóc czatowi w zrozumieniu struktury Twoich danych. Model może też mieć problemy z odczytywaniem skrótów lub nazw własnych.

Wiarygodność i aktualność danych

Pamiętaj, że model szkolony był na danych do 2021 roku. Tak więc model może nie posiadać najbardziej aktualnych informacji na tematy bieżących wydarzeń lub ostatnich osiągnięć w niektórych dziedzinach.

Chociaż CLARIN-PL Chat może być użytecznym narzędziem do odpowiadania na pytania, ważne jest, aby używać go odpowiedzialnie i nie polegać na nim zbyt mocno.

Feedback

Jeśli odpowiedź modelu jest niepoprawna lub uważasz, że mogłaby być lepsza, możesz przekazać informację zwrotną, aby pomóc poprawić odpowiedzi w przyszłości.

Dane osobowe

Pamiętaj - nie podawaj danych osobowych ani informacji poufnych w konwersacji czatu, jeśli nie posiadasz odpowiednich zgód na przetwarzanie danych osobowych. Politechnika Wrocławska nie ponosi odpowiedzialności za podawane przez użytkownika dane podczas konwersacji. Nie jesteśmy w stanie usunąć konkretnych odpowiedzi z Twojej historii rozmowy na czacie.

Zespół

  1. Bartosz Walkowiak - deweloper
  2. Dawid Banach - deweloper
  3. Tomasz Walkowiak - deweloper
  4. Magdalena Drewniak - testowanie
  5. Jan Wieczorek - obsługa użytkowników
  6. Paweł Kazienko - współpraca zewnętrzna
  7. Tomasz Naskręt - koordynator projektu
  8. Jan Kocoń - koordynator projektu
  9. Maciej Piasecki - koordynator konsorcjum naukowego CLARIN-PL

Cytowanie

CLARIN-PL Chat jest kontynuacją dużego badania jakości ChatGPT dla wielu zadań przetwarzania języka naturalnego. Badanie wykazało, że jakość ChatGPT jest istotnie gorsza od najlepszych modeli w zakresie testowanych problemów. Obecnie interesuje nas, które zadania ChatGPT rozwiązuje gorzej zwłaszcza dla języka polskiego. Jeżeli prowadzisz badania naukowe z wykorzystaniem naszego okienka, prosimy o zacytowanie publikacji:

@misc{kocon2023chatgpt, title={ChatGPT: Jack of all trades, master of none}, author={Jan Kocoń and Igor Cichecki and Oliwier Kaszyca and Mateusz Kochanek and Dominika Szydło and Joanna Baran and Julita Bielaniewicz and Marcin Gruza and Arkadiusz Janz and Kamil Kanclerz and Anna Kocoń and Bartłomiej Koptyra and Wiktoria Mieleszczenko-Kowszewicz and Piotr Miłkowski and Marcin Oleksy and Maciej Piasecki and Łukasz Radliński and Konrad Wojtasik and Stanisław Woźniak and Przemysław Kazienko}, year={2023}, eprint={2302.10724}, archivePrefix={arXiv}, primaryClass={cs.CL} }

Najczęściej zadawane pytania

Korzystanie z CLARIN-PL Chat jest bezpłatne.

CLARIN-PL Chat do generowania odpowiedzi korzysta z ChatGPT - modelu językowego wytrenowanego do tworzenia tekstu. ChatGPT został zoptymalizowany pod kątem dialogu poprzez zastosowanie uczenia przez wzmocnienie (_Reinforcement Learning_) oraz odpowiedzi ludzi (_Human Feedback RLHF_).

Modele językowe sztucznej inteligencji opierają się na ogromnych zbiorach danych i konwersacji z Internetu. Nie mamy informacji, jak powstawał ChatGPT, ale najprawdopodobniej do jego wyuczenia wykorzystano niewiele danych po polsku w stosunku do innych języków. Model stosuje więc międzyjęzykowy transfer wiedzy na podstawie bazy tłumaczeń. Polskie komentarze i reakcje Użytkowników dokonwywane poprzez CLARIN-PL Chat będą przeglądane przez zespół badaczy. Zapytania i wnioski z tych rozmów będą służyły do prac nad modelami lepiej oddającymi specyfikę i tematy interesujące Polaków. Jednak do trenowania modeli na użytek komercyjny same odpowiedzi z modelu ChatGPT nie będą wykorzystywane.

Modele te zostały wytrenowane na ogromnych ilościach danych z internetu napisanych przez ludzi, w tym na rozmowach, więc odpowiedzi, których udziela model, mogą brzmieć jak ludzkie. Należy pamiętać, że jest to bezpośredni rezultat systemu (tj. maksymalizacja podobieństwa pomiędzy wynikami a zbiorem danych, na którym modele były szkolone) i że takie wyniki mogą być czasami niedokładne, nieprawdziwe lub w inny sposób mylące.

CLARIN-PL Chat nie posiada bieżącej wiedzy o świecie i może czasami udzielać błędnych odpowiedzi. Model został wytrenowany na danych do 2021 roku. Może on również czasami produkować szkodliwe instrukcje, nieprawdziwe "fakty" lub stronnicze treści. Zalecamy sprawdzenie, czy odpowiedzi z modelu są prawidłowe czy nie. Jeśli uznasz, że odpowiedź jest nieprawidłowa, przekaż informację zwrotną za pomocą przycisku. Pomoże to nam w ulepszaniu usługi oraz badaniach nad generatywnymi modelami językowymi.

W ramach naszego zaangażowania w bezpieczną i odpowiedzialną sztuczną inteligencję przeglądamy konwersacje w celu ulepszenia naszych systemów i zapewnienia, że treść jest zgodna z naszymi zasadami i wymogami bezpieczeństwa. Teksty rozmów będą też wykorzystane do badań naukowych.

Tak. Twoje rozmowy mogą być przeglądane w celu ulepszenia naszych systemów.

Tak, proszę postępować zgodnie z procesem usuwania danych określonym w [Regulaminie](https://chat.clarin-pl.eu/pl/terms). Konwersacji na czacie nie jesteśmy w stanie usunąć z bazy danych. Prosimy więc o uważne korzystanie z serwisu.

Nie, nie jesteśmy w stanie usunąć wybranych odpowiedzi z Twojej historii rozmowy na czacie. Prosimy nie udostępniać żadnych wrażliwych informacji w swoich rozmowach.

Tak, możesz przeglądać i kontynuować wcześniejsze rozmowy. Po lewej stronie czatu znajduje się historia prowadzonych konwersacji.

Więcej informacji o tym, jak obchodzimy się z danymi, znajdziesz w naszym [Regulaminie](https://chat.clarin-pl.eu/pl/terms). Pamiętaj: nie zamieszczaj żadnych danych osobowych ani informacji poufnych na czacie.

Model językowy nie zawsze będzie udzielał odpowiedzi zgodnych z oczekiwaniami i może się mylić np. co do faktów. W takiej sytuacji spróbuj sparafrazować pytanie, dookreślić szczegóły lub nadać szerszy kontekst wypowiedzi. Nie zapomnij też o skomentowaniu odpowiedzi czatu, co pozwoli nam na prowadzenie badań i ulepszanie narzędzia. Więcej wskazówek uzyskasz w przewodniku: [Przewodnik po CLARIN-PL Chat](https://chat.clarin-pl.eu/pl/info).

Tak, można korzystać z CLARIN-PL Chat bez logowania, ale liczba zapytań jest ograniczona dziennie i resetowana każdego dnia o północy.

Wciąż masz pytania?

Napisz do nas na
CLARIN-PL @ 2023