Zaloguj

Przeglądaj

Fiszki

egzamin lodzik

Test w formie fiszek

Ilość pytań: 26 Rozwiązywany: 1000 razy

Test Turinga ma na celu sprawdzenie czy komputer może:

Przekształcać w sposób automatyczny mowę na tekst

Prowadzić dialog z człowiekiem poprzez wymianę komunikatów tekstowych

Rozpoznawać strukturę wypowiedzi poprzez zastosowanie modelu zwanego maszyną Turinga

Dokonywać automatycznego tłumaczenia tekstów dostarczonych przez użytkownika w postaci komunikatów tekstowych

Prowadzić dialog z człowiekiem poprzez wymianę komunikatów tekstowych

Ważona reprezentacja logarytmiczna (model TFIDF) zakłada, że waga przypisana wyrazowi:

Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz

Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz

Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz

Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających danych wyraz

Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz

) Rozkład według wartości osobliwych macierzy częstości pozwala na wyznaczanie wektorów reprezentujących dokumenty i wyrazy w taki sposób, że:

Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są zbliżone do relacji pomiędzy oryginalnymi wektorami pochodzącymi z macierzy częstości reprezentującymi dokumenty i wyrazy

Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są identyczne dla wektorów reprezentujących dokumenty jak i wektorów reprezentujących wyrazy

Wszystkie współczynniki korelacji między wektorami są zerowe (wektory prostopadłe)

Wszystkie współczynniki korelacji pomiędzy wektorami są równe jedności

Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są zbliżone do relacji pomiędzy oryginalnymi wektorami pochodzącymi z macierzy częstości reprezentującymi dokumenty i wyrazy

Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie są prawdziwe:

W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową

Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami

Wyniki działania metod aglomeracyjnych przedstawia się w postaci dendrogramu

Metoda k-średnich jest metodą niehierarchiczną

W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową

Drzewo klasyfikacyjne jest metodą

Aglomeracyjną metodą grupowania

Wyznaczania podobieństwa pomiędzy obiektami

Klasyfikacji wzorcowej

Klasyfikacji bezwzorcowej

Aglomeracyjną metodą grupowania

Drzewo klasyfikacyjne można przekształcić do postaci:

Reguł decyzyjnych

Ontologii

Macierzy korelacji

Dendrogramu

Reguł decyzyjnych

Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:

Zakłada niezależność zmiennych niezależnych

Daje wyniki o niskiej jakości

Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne

Jest prosty w obliczeniach

Zakłada niezależność zmiennych niezależnych

Metoda ukrytej alokacji Dirichleta (LDA):

Określa dla każdego dokumentu prawdopodobieństwo do poszczególnych tematów określonych przez użytkownika do postaci zbioru uczącego

Metodą identyfikacji tematów opartą na dekompozycji macierzy częstości według wartości osobliwych

Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów

Zidentyfikować w korpusie zadaną przez użytkownika liczbę tematów poprzez zastosowanie algorytmu uczenia zwanym nauczycielem

Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów

Prawo Zipfa odnosi się do listy wystąpień wyrazów w korpusie uporządkowanej malejąco według częstości wystąpień mówi, że:

Liczba wystąpień poszczególnych wyrazów jest proporcjonalna do ich pozycji na liście

Liczba wystąpień poszczególnych wyrazów jest odwrotnie proporcjonalna do ich pozycji na liście

Liczba wystąpień poszczególnych wyrazów nie jest skorelowana z ich pozycją na liście

Liczba wystąpień poszczególnych wyrazów jest proporcjonalna do logarytmu ich pozycji na liście

Liczba wystąpień poszczególnych wyrazów jest odwrotnie proporcjonalna do ich pozycji na liście

Algorytm RAKE jest algorytmem identyfikacji słów kluczowych, który:

Działa w trybie nauczania

Wymaga łącznego przetworzenia wszystkich dokumentów wchodzących w skład korpusu

Oparty na przyjętej ontologii

Nie korzysta z wiedzy dziedzinowej

Ontologia to:

Model probabilistyczny opisujący sposób zachowania się systemu

Wynik działania metody data-miningowej przyjmujący postać dendrogramu

Sformalizowany sposób opisu wiedzy dziedzinowej

Model powiązań miedzy słowami skonstruowany poprzez dekompozycje macierzy częstości

Sformalizowany sposób opisu wiedzy dziedzinowej

Predykat w języku Prolog reprezentuje:

Obiekt

Atrybut

Kwantyfikator

Funkcję

Gramatyka bezkontekstowa jest równoważna:

Gramatyce regularnej lewostronnej

Automatowi ze stosem

Gramatyce regularnej prawostronnej

Automatowi skończonemu

Automatowi ze stosem

Niedeterministyczne automaty skończone są w stanie akceptować:

Języki bezkontekstowe

Języki rekurencyjne przeliczalne

Języki regularne

Języki kontekstowe

Języki regularne

Dysponując gramatyką w postaci: S-> ba | aSb, wskaż który z poniższych łańcuchów należy do języka opisywanego przez tę gramatykę:

bababa

ababab

aaabbb

aababb

Notacja Backusa-Naura jest metodą opisu języków:

Bezkontekstowych

Regularnych

Rekurencyjne przeliczalnych

Kontekstowych

Bezkontekstowych

Reprezentacja unigramowa kolekcji dokumentów

Wymaga uczenia w trybie z nauczycielem

Bazuje na dekompozycji według wartości osobliwych

Nie uwzględnia kolejności wyrazów w tekście

Zapewnia ortogonalność kolumn i wierszy macierzy częstości

Nie uwzględnia kolejności wyrazów w tekście

Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie jest prawdziwe:

Wyniki działania metod aglomeracyjnych przedstawia się w postaci drzewa klasyfikacyjnego

W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu minimalnym zwiększyć wariancję wewnątrzgrupową

Metoda k-średnich jest metoda niehierarchiczną

Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami

Wyniki działania metod aglomeracyjnych przedstawia się w postaci drzewa klasyfikacyjnego

Metoda najbliższego sąsiedztwa jest metodą:

Wyznaczania podobieństwa pomiędzy obiektami

Aglomeracyjną metodą grupowania

Klasyfikacji wzorcowej

Klasyfikacji bezwzorcowej

Aglomeracyjną metodą grupowania

Liście w drzewie klasyfikacyjnym reprezentują:

Obiekty

Reguły decyzyjne

Klasy, do których zaliczane są obiekty

Cechy charakteryzujące obiekty

Klasy, do których zaliczane są obiekty

Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:

Jest prosty w obliczeniach

Zakłada, że zmienne opisujące obiekty są nieskorelowane

Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne

Daje wynik o niskiej jakości

Zakłada, że zmienne opisujące obiekty są nieskorelowane

Algorytm RAKE

wymaga łącznego przetworzenia wszystkich dokumentów wchodzących w skład korpusu

pozwala na identyfikację istotnych sekwencji słów

oparty jest na bazie wiedzy dziedzinowej

uczony jest poprzez prezentację przykładowych słów istotnych

pozwala na identyfikację istotnych sekwencji słów

Zapisy algorytmów w języku Prolog wykorzystują zwykle:

Iterację

Dziedziczenie

Polimorfizm

Rekurencję

Gramatyka regularna jest równoważna:

Maszynie Turinga

Automatowi ze stosem

Automatowi skończonemu

Notacji Backusa-Naura

Automatowi skończonemu

Dysponując gramatyką w postaci S -> ab | aSb wskaż, który z poniższych łańcuchów należy do języka opisywanego przez tę gramatykę:

aababb

aaabbb

bababa

ababab

aaabbb

Język Java jest językiem:

Bezkontekstowym

Rekurencyjnie przeliczalnym

Regularnym

Kontekstowym

Bezkontekstowym

Powiązane tematy

Inne tryby

Nauka Test Powtórzenie