Fiszki

egzamin lodzik

Test w formie fiszek
Ilość pytań: 26 Rozwiązywany: 1000 razy
Test Turinga ma na celu sprawdzenie czy komputer może:
Przekształcać w sposób automatyczny mowę na tekst
Prowadzić dialog z człowiekiem poprzez wymianę komunikatów tekstowych
Rozpoznawać strukturę wypowiedzi poprzez zastosowanie modelu zwanego maszyną Turinga
Dokonywać automatycznego tłumaczenia tekstów dostarczonych przez użytkownika w postaci komunikatów tekstowych
Prowadzić dialog z człowiekiem poprzez wymianę komunikatów tekstowych
Ważona reprezentacja logarytmiczna (model TFIDF) zakłada, że waga przypisana wyrazowi:
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających danych wyraz
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz
) Rozkład według wartości osobliwych macierzy częstości pozwala na wyznaczanie wektorów reprezentujących dokumenty i wyrazy w taki sposób, że:
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są zbliżone do relacji pomiędzy oryginalnymi wektorami pochodzącymi z macierzy częstości reprezentującymi dokumenty i wyrazy
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są identyczne dla wektorów reprezentujących dokumenty jak i wektorów reprezentujących wyrazy
Wszystkie współczynniki korelacji między wektorami są zerowe (wektory prostopadłe)
Wszystkie współczynniki korelacji pomiędzy wektorami są równe jedności
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są zbliżone do relacji pomiędzy oryginalnymi wektorami pochodzącymi z macierzy częstości reprezentującymi dokumenty i wyrazy
Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie są prawdziwe:
W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową
Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami
Wyniki działania metod aglomeracyjnych przedstawia się w postaci dendrogramu
Metoda k-średnich jest metodą niehierarchiczną
W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową
Drzewo klasyfikacyjne jest metodą
Aglomeracyjną metodą grupowania
Wyznaczania podobieństwa pomiędzy obiektami
Klasyfikacji wzorcowej
Klasyfikacji bezwzorcowej
Aglomeracyjną metodą grupowania
Drzewo klasyfikacyjne można przekształcić do postaci:
Reguł decyzyjnych
Ontologii
Macierzy korelacji
Dendrogramu
Reguł decyzyjnych
Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:
Zakłada niezależność zmiennych niezależnych
Daje wyniki o niskiej jakości
Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne
Jest prosty w obliczeniach
Zakłada niezależność zmiennych niezależnych
Metoda ukrytej alokacji Dirichleta (LDA):
Określa dla każdego dokumentu prawdopodobieństwo do poszczególnych tematów określonych przez użytkownika do postaci zbioru uczącego
Metodą identyfikacji tematów opartą na dekompozycji macierzy częstości według wartości osobliwych
Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów
Zidentyfikować w korpusie zadaną przez użytkownika liczbę tematów poprzez zastosowanie algorytmu uczenia zwanym nauczycielem
Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów
Prawo Zipfa odnosi się do listy wystąpień wyrazów w korpusie uporządkowanej malejąco według częstości wystąpień mówi, że:
Liczba wystąpień poszczególnych wyrazów jest proporcjonalna do ich pozycji na liście
Liczba wystąpień poszczególnych wyrazów jest odwrotnie proporcjonalna do ich pozycji na liście
Liczba wystąpień poszczególnych wyrazów nie jest skorelowana z ich pozycją na liście
Liczba wystąpień poszczególnych wyrazów jest proporcjonalna do logarytmu ich pozycji na liście
Liczba wystąpień poszczególnych wyrazów jest odwrotnie proporcjonalna do ich pozycji na liście
Algorytm RAKE jest algorytmem identyfikacji słów kluczowych, który:
Działa w trybie nauczania
Wymaga łącznego przetworzenia wszystkich dokumentów wchodzących w skład korpusu
Oparty na przyjętej ontologii
Nie korzysta z wiedzy dziedzinowej
Nie korzysta z wiedzy dziedzinowej
Ontologia to:
Model probabilistyczny opisujący sposób zachowania się systemu
Wynik działania metody data-miningowej przyjmujący postać dendrogramu
Sformalizowany sposób opisu wiedzy dziedzinowej
Model powiązań miedzy słowami skonstruowany poprzez dekompozycje macierzy częstości
Sformalizowany sposób opisu wiedzy dziedzinowej
Predykat w języku Prolog reprezentuje:
Obiekt
Atrybut
Kwantyfikator
Funkcję
Funkcję
Gramatyka bezkontekstowa jest równoważna:
Gramatyce regularnej lewostronnej
Automatowi ze stosem
Gramatyce regularnej prawostronnej
Automatowi skończonemu
Automatowi ze stosem
Niedeterministyczne automaty skończone są w stanie akceptować:
Języki bezkontekstowe
Języki rekurencyjne przeliczalne
Języki regularne
Języki kontekstowe
Języki regularne
Dysponując gramatyką w postaci: S-> ba | aSb, wskaż który z poniższych łańcuchów należy do języka opisywanego przez tę gramatykę:
bababa
ababab
aaabbb
aababb
aababb
Notacja Backusa-Naura jest metodą opisu języków:
Bezkontekstowych
Regularnych
Rekurencyjne przeliczalnych
Kontekstowych
Bezkontekstowych
Reprezentacja unigramowa kolekcji dokumentów
Wymaga uczenia w trybie z nauczycielem
Bazuje na dekompozycji według wartości osobliwych
Nie uwzględnia kolejności wyrazów w tekście
Zapewnia ortogonalność kolumn i wierszy macierzy częstości
Nie uwzględnia kolejności wyrazów w tekście
Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie jest prawdziwe:
Wyniki działania metod aglomeracyjnych przedstawia się w postaci drzewa klasyfikacyjnego
W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu minimalnym zwiększyć wariancję wewnątrzgrupową
Metoda k-średnich jest metoda niehierarchiczną
Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami
Wyniki działania metod aglomeracyjnych przedstawia się w postaci drzewa klasyfikacyjnego
Metoda najbliższego sąsiedztwa jest metodą:
Wyznaczania podobieństwa pomiędzy obiektami
Aglomeracyjną metodą grupowania
Klasyfikacji wzorcowej
Klasyfikacji bezwzorcowej
Aglomeracyjną metodą grupowania
Liście w drzewie klasyfikacyjnym reprezentują:
Obiekty
Reguły decyzyjne
Klasy, do których zaliczane są obiekty
Cechy charakteryzujące obiekty
Klasy, do których zaliczane są obiekty
Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:
Jest prosty w obliczeniach
Zakłada, że zmienne opisujące obiekty są nieskorelowane
Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne
Daje wynik o niskiej jakości
Zakłada, że zmienne opisujące obiekty są nieskorelowane
Algorytm RAKE
wymaga łącznego przetworzenia wszystkich dokumentów wchodzących w skład korpusu
pozwala na identyfikację istotnych sekwencji słów
oparty jest na bazie wiedzy dziedzinowej
uczony jest poprzez prezentację przykładowych słów istotnych
pozwala na identyfikację istotnych sekwencji słów
Zapisy algorytmów w języku Prolog wykorzystują zwykle:
Iterację
Dziedziczenie
Polimorfizm
Rekurencję
Rekurencję
Gramatyka regularna jest równoważna:
Maszynie Turinga
Automatowi ze stosem
Automatowi skończonemu
Notacji Backusa-Naura
Automatowi skończonemu
Dysponując gramatyką w postaci S -> ab | aSb wskaż, który z poniższych łańcuchów należy do języka opisywanego przez tę gramatykę:
aababb
aaabbb
bababa
ababab
aaabbb
Język Java jest językiem:
Bezkontekstowym
Rekurencyjnie przeliczalnym
Regularnym
Kontekstowym
Bezkontekstowym

Powiązane tematy

Inne tryby