Strona 1

egzamin lodzik

Pytanie 1
Test Turinga ma na celu sprawdzenie czy komputer może:
Rozpoznawać strukturę wypowiedzi poprzez zastosowanie modelu zwanego maszyną Turinga
Prowadzić dialog z człowiekiem poprzez wymianę komunikatów tekstowych
Dokonywać automatycznego tłumaczenia tekstów dostarczonych przez użytkownika w postaci komunikatów tekstowych
Przekształcać w sposób automatyczny mowę na tekst
Pytanie 2
Ważona reprezentacja logarytmiczna (model TFIDF) zakłada, że waga przypisana wyrazowi:
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających danych wyraz
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Pytanie 3
) Rozkład według wartości osobliwych macierzy częstości pozwala na wyznaczanie wektorów reprezentujących dokumenty i wyrazy w taki sposób, że:
Wszystkie współczynniki korelacji między wektorami są zerowe (wektory prostopadłe)
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są identyczne dla wektorów reprezentujących dokumenty jak i wektorów reprezentujących wyrazy
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są zbliżone do relacji pomiędzy oryginalnymi wektorami pochodzącymi z macierzy częstości reprezentującymi dokumenty i wyrazy
Wszystkie współczynniki korelacji pomiędzy wektorami są równe jedności
Pytanie 4
Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie są prawdziwe:
Wyniki działania metod aglomeracyjnych przedstawia się w postaci dendrogramu
Metoda k-średnich jest metodą niehierarchiczną
W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową
Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami
Pytanie 5
Drzewo klasyfikacyjne jest metodą
Aglomeracyjną metodą grupowania
Wyznaczania podobieństwa pomiędzy obiektami
Klasyfikacji wzorcowej
Klasyfikacji bezwzorcowej
Pytanie 6
Drzewo klasyfikacyjne można przekształcić do postaci:
Reguł decyzyjnych
Dendrogramu
Ontologii
Macierzy korelacji
Pytanie 7
Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:
Daje wyniki o niskiej jakości
Jest prosty w obliczeniach
Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne
Zakłada niezależność zmiennych niezależnych
Pytanie 8
Metoda ukrytej alokacji Dirichleta (LDA):
Metodą identyfikacji tematów opartą na dekompozycji macierzy częstości według wartości osobliwych
Zidentyfikować w korpusie zadaną przez użytkownika liczbę tematów poprzez zastosowanie algorytmu uczenia zwanym nauczycielem
Określa dla każdego dokumentu prawdopodobieństwo do poszczególnych tematów określonych przez użytkownika do postaci zbioru uczącego
Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów

Powiązane tematy