Pytanie 1

które funkcje straty są używane w zadaniu regresji?

wybierz wszystkie poprawne:

a  Binarna entropia krzyżowa

B  średni błąd bezwzględny

C  błąd sredniokwadratowy

 

 

Pytanie 2

Jednym z problemów z zastosowaniem funkcji sigmoidalnej (logistycznej) jest jej nasycenie

dla dużych i malych wartości  Czy zastosowanie funkcji tangensa hiperbolicznego jako

funkcji aktywacji pozwala uniknąć tego problemu?

Wybierz jedną odpowiedź:

Prawda

FAŁSZ

 

 

Pytanie 3

Główne ograniczenie metody propagacji wstecznej to:

Wybierz wszystkie poprawne:

A  wolna zbieżność?

B  minimuma lokalne?

C  skalowalność?

 

 

Pytanie 4

Dobór początkowej wartości współczynnika uczenia przy użyciu optymalizacji współczynnika

uczenia nie ma wpływu na szybkość uczenia modelu  Prawda czy fałsz?

Wybierz jedną odpowiedź:

Prawda

FAŁSZ

Pytanie 5

Czym jest funkcja kosztu?

a  inna nazwa dla funkcji aktywacji

B  funkcja określająca jak dobrze model funkcjonuje przy danych wartościach

parametrów

c  metoda używana do znalezienia minimum funkcji

d  funkcja opisująca jak bardzo złożona obliczeniowo jest sieć

 

 

Pytanie 6

Eksploracyjna analiza danych (EDA) powinna być krokiem wstępnym przed użyciem metody

maszynowego uczenia  Poniżej zamieszczono na jej temat kilka stwierdzeń  Zaznacz to,

które jest Twoim zdaniem NIEPRAWDZIWE

a  Podsumowuje charakterystykę danych

b  Używa metod wizualizacji danych

C  Dostarcza informacji o dokładności rozpoznawania dla modelu wyuczonego na tych

danych

 

 

Pytanie 7

Zaznacz te elementy, spośród wymienionych, które wpływają na szybkość uczenia

Wybierz wszystkie poprawne:

A  wartość początkowych wag

B  liczba użytych neuronów w sieci

C  użyta funkcja aktywacji

D  wartość współczynnika uczenia

 

 

 

 

 

Pytanie 8

Mamy zamodelować szansę przeżycia pacjentki z rakiem piersi na podstawie jej wieku i

rozmiaru guza  Jaki rodzaj modelu proponowałbyś użyć? Szansę nalezy rozumieć jako

ocenę czy przeżyje 5 lat czy nie  Zaznacz właściwe

a  Regresja liniowa

B  Regresja logistyczna

 

 

Pytanie 9

Zidentyfikuj funkcję aktywacji, która zapisana jest następującym wzorem (X-wektor wejść, V

– wektor wag, b-bias)

(V) – 1/ (1 + exp ^(-1)( X * V + b) ), znak ^ oznacza podniesienie do potęgi

a  funkcja ReLU

b  Funkcja Gaussa

C  funkcja sigmoidalna

d  Funkcja skokowa

 

 

Pytanie 10

Które z podanych niżej funkcji NIE mogą być stosowane w sieci MLP uczonej metodą

propagacji wstecznej?

A  funkcja progowa

b  funkcja tożsamościowa

c  funkcja sigmoidalna

d  funkcja softmax

 

 

 

 

 

 

Pytanie 11

Które z podanych stwierdzeń dotyczących uczenia metodą SGD na małych paczkach (mini

batch SGD) jest FAŁSZEM?

A  efekt działania tej metody jest identyczny z SGD (stochastic gradient)

b  aktualizacja wag wykonuje się na pojedynczej paczce wzorców

c  rozmiar paczki (batch size) jest hiperparametrem, który jest dostrajany

 

 

Pytanie 12

Które ze stwierdzeń najlepiej definiuje pojęcie generalizacji w odniesieniu do sieci

neuronowych:

a  zdolność do zapamiętywania wzorców

b  zdolność do przetwarzania wzorców

C  zdolność do wyuczenia się funkcji odwzorowującej dane wejściowe na wyjściowe

 

 

Pytanie 13

Określ w jaki sposób rzutowane są gradienty błędów w metodzie propagacji wstecznej w

celu aktualizacji wag

a  od warstwy wyjściowej do ukrytej

b  Od warstwy wejściowej do wyjściowej

c  Od warstwy wejściowej do ukrytej

D  od warstwy wyjściowej do wejściowej

 

 

Pytanie 14

Skalujemy wejścia sieci neuronowej, żeby poprawić zbieżność i przyspieszyć proces

uczenia

Wybierz jedną odpowiedź:

PRAWDA

Fałsz

Pytanie 15

Liczba wag (nie licząc biasów) w sieci MLP w pełni połączonej o 5 neuronach w warstwie

wejściowej i 5 neuronach w warstwie ukrytej oraz 3 warstwie wyjściowej wynosi:

a  75

b  28

C  40

d  13

e

 

 

Pytanie 16

Skąd bierze się termin naiwny w naiwnym klasyfikatorze Bayesa

A  Bo robimy założenie o warunkowej niezależności zmiennych wejściowych względem

klasy

b  Bo Bayes wykazał się naiwnością

c  Bo stosujemy wzór Bayesa w uproszczonej formie

 

 

Pytanie 17

Propagacja wsteczna to technika uczenia sieci neuronowych  Określ co rzutuje się wstecz

zaznaczając właściwą odpowiedź

a  Zmiany wag

B  Gradient błędu

 

 

 

 

 

 

 

 

Pytanie 18

Budujemy klasyfikator wykorzystujący sieć w pełni połączoną  Zadanie do rozwiązania przez

sieć polega na tym, żeby znaleźć zdjęcia zawierające legwana lub niedźwiedzia (może być

tylko jedno zwierzę na zdjęciu, ale mogą też być oba), tzn  sieć powinna klasyfikować obraz

jako niezawierający tych zwierząt lub zawierający wymienione zwierzęta niezależnie od tego

ile zwierząt z każdego z wymienionych gatunków jest na zdjęciu  Jakie zadanie

maszynowego uczenia model będzie realizować?

a  klasyfikacje binarną

b  klasyfikacje wieloklasową

C  klasyfikacje wieloetykietową

 

 

Pytanie 19

Jaką odpowiedź zwróci neuron pokazany na poniższym rysunku dla wartości wejść x1=1

x2=1 i wag w0=0,2, w1=-0,7 w2=0,8? Zakładamy, że funkcja skoku występuje w 0

Poprawna odpowiedź to: 1

 

 

Pytanie 20

Które z tych stwierdzeń jest FAŁSZEM?

a  Wartości początkowych wag sieci mogą wydłużać proces uczenia

b  Wartości początkowych wag, wpływają na skuteczność wyuczenia sieci

C  Korzystając z zaimplementowanego modelu sieci, niezależnie od wartości

początkowych wag, sieć zawsze wyuczy się określonego zadania

 

Pytanie 21

Które z podanych czynników tworzą nieliniową naturę sieci neuronowych?

a  warstwy ukryte

b  Regularyzacja

c  Wagi i biasy

D  funkcje aktywacji

Pytanie 22

Uczenie sieci przez zbyt dużą liczbę epok prowadzi do (zaznacz właściwe odpowiedzi):

Wybierz wszystkie poprawne:

A  długiego czasu uczenia

B  przeuczenia

C  niepotrzebnej straty czasu

 

 

Pytanie 23

EDA to eksploracyjna analiza danych  Zaznacz techniki jakie są w niej wykorzystywane

Wybierz wszystkie poprawne:

A  Podejście statystyczne

B  Metody wizualizacji

c  Metody do analizy zastosowanego modelu

 

 

Pytanie 24

Jaki jest cel użycia regularyzacji L1 i L2 w sieciach neuronowych?

A  poprawa generalizacji

b  unikanie zanikającego gradientu

c  unikanie wybuchającego gradientu

 

 

Pytanie 25

Zadanie klasyfikacji i regresji musi być wykonywane przy użyciu odpowiedniej funkcji straty

(kosztu)  Wybierz właściwe funkcje dla obu zadań spośród propozycji podanych poniżej

A  Dla zadania regresji błąd średniokwadratowy a dla zadania klasyfikacji entropia

krzyżowa

b  Dla zadania regresji entropia krzyżowa, dla zadania klasyfikacji entropia binarna

c  Dla klasyfikacji funkcja logistyczna, dla zadania regresji funkcja logistyczna

 

Pytanie 26

Poniżej przedstawiona jest charakterystyka regresji logicznej

Zaznacz stwierdzenia PRAWDZIWE

Wybierz wszystkie poprawne:

A  Funkcja dopasowania to entropia krzyżowa

b  Zmienna zależna powinna być ciągła

C  Do modelowania prawdopodobieństwa w regresji binarnej stosowana jest funkcja

sigmoidalna

 

 

Pytanie 27

Załóżmy, że neuron otrzymuje n wejść x1, x2, x3……  xn na połączeniach z wagami w1,

w2,        wn  Całkowite pobudzenie przesyłanie do funkcji aktywacji wyraża się wzorem:

a  Σ wi + Σ xi

b  Σ xi

c  Σ wi

D  Σ wi*xi

 

 

Pytanie 28

Dlaczego nie powinniśmy inicjalizować wag ustawiając je wszystkie=0

A  w takiej sytuacji wszystkie neurony ukryte mają ten sam gradient

b  mamy zjawisko zanikającego gradientu w sieci

c  występuje zjawisko przeuczenia się sieci

 

 

 

 

 

 

 

Pytanie 29

Które ze stwierdzeń jest PRAWDZIWE?

A  funkcja softmax jest używana w warstwie wyjściowej, funkcja sigmoidalna w warstwie

ukrytej

b  funkcja softmax jest używana w warstwie ukrytej, funkcja sigmoidalna w warstwie

wyjściowej

c  softmax jest zazwyczaj używana dla problemów binarnej klasyfikacji

d  żadna odpowiedź nie jest prawidłowa

 

 

Pytanie 30

Które ze stwierdzeń odnośnie inicjalizacji wag jest FAŁSZEM?

A  początkowo najlepiej wszystkie wagi ustawić na 0

b  czas trenowania sieci może się wydłużyć z powodu złej inicjalizacji wag

c  z powodu złej inicjacji wag może się pojawić problem znikającego lub

eksplodującego gradientu

 

 

Pytanie 31

Co to jest funkcja aktywacji

A funkcja umożliwiająca sieci rozwiązać nieliniowe problemy

b  sposób okreslenia jak dobrze model funkcjonuje przy danych wartosciach parametrow

c  funkcja opisujaca zlozonosc sieci neuronowej

d  algorytm opltymalizacji sluzacy do znalezienia parametrow (wspolczynnikow) funkcji minimalizującej funkcję kosztu

 

Pytanie 32

Jakie elementy wpływają na optymalizację współczynnika uczenia we współczesnych  implementacjach sieci neuronowych (optymalizatory współczynnika uczenia)?

A Wartość aktualnego gradientu

B  zdyskontowana suma poprzednich gradientów

C krok uczenia

 

Pytanie 33

Dokładność wyuczenia modelu nie poprawia się przez wiele epok  Co może być przyczyną takiej sytuacji? Zaznacz właściwą odpowiedź

A  dobór hiperparametrów

B  źle dobrana funkcja straty

C  dane trenujące

D  architektura sieci

 

 

Pytanie 34

Czym jest operacja podziału (splitting) w drzewie decyzyjnym?

a  Wszystkie wymienione odpowiedzi są prawdziwe

b  Usunięciem podwęzła (węzła potomnego) w drzewie

C  Stworzenie dwóch lub więcej węzłów potomnych danego węzła

d  Balansowaniem zbioru danych przed uczenieniem

 

 

Pytanie 35

Które ze stwierdzeń o funkcji kosztu są FAŁSZYWE?

a  kodowanie wartości wyjściowych w postaci „1 z n”  jest wymagane dla entropii krzyżowej

b  błąd średniokwadratowy jest zazwyczaj używany w problemach regresji

C  Żadne z wymienionych

d  funkcja entropii krzyżowej może być stosowana zarówno w problemach binarnej klasyfikacji,  jak i klasyfikacji wieloklasowej

 

 

 

 

 

 

 

 

Pytanie 36 (może być/nie musi wiecej porawnych – C jest na pewno zle)

Mamy do rozwiązania problem  Należy użyć modelu do predykcji ceny dolara w zależności od cen innych walut (funt, euro) oraz inflacji  Wybierz odpowiednie według Ciebie podejścia

A  regresja liniowa z funkcją straty w postaci błędu średniokwadratowego

b  regresja logistyczna z funkcją straty w postacie entropii krzyżowej

c  Sieć MLP z funkcją straty jako entropią krzyżową

d  Sieć MLP z funkcją straty w postaci błędu średniokwadratowego

 

 

Pytanie 37

W jaki sposób powinny być zakodowane wejścia sieci neuronowej biorąc pod uwagę typ wartości cechy podawanej na wejście

Jak powinny być wstępnie przetworzone wartości cech będące wartościami rzeczywistymi?

powinno się przeprowadzic skalowanie/ normalizację

Jak powinny być wstępnie reprezentowane cechy będące wartościami nominalnymi?

                powinny być zakodowane 1 z n

Jak powinny być  wstępnie przetworzone wejścia dla wartości binarnych

                nie powinniśmy przeprowadzać wstępnego przetwarzania danych

 

Pytanie 38

Do rozwiązywania  jakich zadań mozna wykorzystywać sieci uczone metodą propagacji wstecznej?

a  klasyfikacji

B  wszystkich wymienionych w pozostałych punktach

c  regresji

d  rozpoznawania wzorców

 

Pytanie 39

Które z podanych stwierdzeń o momentum jest PRAWDZIWE? Momentum  

A  wpływa na kierunek gradientu w metodzie SGD

B  Pomaga w szybszej zbieżności uczenia

C  Pomaga SGD unikać lokalnych minimów

Pytanie 40

Skalujemy wejścia sieci neuronowej, żeby poprawić zbieżność i przyspieszyć proces uczenia

PRAWDA

Fałsz

 

Pytanie 41 (JEST WIECEJ POPRAWNYCH ODPOWIEDZI)

Co się stanie jesli zainicjowane wagi będą bardzo duże?

a  nie ma to znaczenia

B  może wystapić zjawisko zainikającego gradientu

c  może wystapić  zjawisko wybuchającego gradientu

 

 

Pytanie 42

Które z tych stwierdzeń jest FAŁSZEM?

a  Wartości początkowych wag sieci mogą wydłużać proces uczenia

B  Korzystajac z zaimplementowanego modelu sieci, niezależnie od wartości początkowych wag, sieć zawsze wyuczy się określonego zadania

c  Wartości początkowych wag, wpływają na skuteczność wyuczenia sieci

 

 

Pytanie 43

Przyjmijmy, że rozważamy neuron o trzech wejściach  z wektorem wag  [0 2 -0 1 0 1]^T i biasem θ = 0  Jeśli wektor wejściowy x = [0 2 0 4 0 2]^T jest podawany na wejście , to całkowite pobudzenie jest równe:

a  0 20

B  0,02

c  1

d  -1

 

 

 

 

Pytanie 43

Które z podanych stwierdzeń dotyczących uczenia metodą SGD na małych paczkach (mini batch SGD) jest FAŁSZEM?

A  efekt działania tej metody jest identyczny z SGD (stochastic gradient)

b  rozmiar paczki (batch size) jest hiperparametrem, który jest dostrajany

c  aktualizacja wag wykonuje się na pojedynczej paczce wzorców

 

 

Pytanie 44 (IDK KTÓRA ODPOWIEDZ- NA PEWNO NIE A)

Jaki jest cel stosowania funkcji aktywacji w sieciach neuronowych?

a  Aby znormalizować wejścia

b  Aby zwiększyć głębokość sieci

c  Aby utworzyć połączenia między warstwami

D  Aby wprowadzić nieliniowość w neuronie

 

 

Pytanie 45 (IDK KTÓRA ODPOWIEDZ- NA PEWNO NIE B)

W drzewie decyzjnym entropia pomaga wyznaczyć cechę albo atrybut, który daje maksimum informacji na temat klasy  Jak nazywa się ta miara? Wybierz właściwą odpowiedź

A  Zysk informacyjny

b  Pruning

c  Długość ścieżki

d  Indeks Giniego

 

 

Pytanie 46

Zaznacz czynniki, które mają wpływ na generalizację (stopień uogólniania) w sieci MLP

A  metoda zatrzymywania uczenia

B  architektura sieci

C  regularyzacja

D  zbiór uczący

 

Pytanie 47 (IDK KTÓRA ODPOWIEDZ)

Które ze stwierdzeń dotyczących funcki sigmoidalnej i softmax jest PRAWDZIWE?

a  żadna odpowiedź nie jest prawdziwa

b  funkcja softmax jest używana w warstwie ukrytej, funkcja sigmoidalna w warstwie wyjściowej

C  funkcja softmax jest używana w warstwie wyjściowej, funkcja sigmoidalna w warstwie ukrytej

d  softmax jest zazwyczaj używana dla problemów binarnej klasyfikacji

 

 

Pytanie 48(IDK KTÓRA ODPOWIEDZ)

Które z podanych terminów NIE pasują do określenia funkcja straty?

a  funkcja celu

b  funkcja błędu

C  funkcja aktywacji

d  funkcja kosztu

 

Pytanie 49(IDK KTÓRA ODPOWIEDZ)

Poniżej przedstawiona jest charakterystyka regresji logistycznej  Zaznacz stwierdzenia PRAWDZIWE

A  Wyjście reprezentuje prawdopodobieństwo przynależnosci do klasy

b  Funkcja dopasowania to entropia krzyżowa

c  Zmienna zależna powinna być ciągła

D  Do modelowania prawdopodobieństwa w regresji binarnej stosowana jest funkcja sigmoidalna

 

 

Pytanie 50(IDK KTÓRA ODPOWIEDZ JEDNA POPRAWNA)

Które z podanych stwierdzeń na temat współczynnika uczenia są FAŁSZYWE?

a  Wpółczynnik uczenia określa jak szybko zmieniają się wagi i biasy w sieci neuronowej

b  Niski współczynnik uczenia spowalnia proces uczenia

C  Istnieje duża szansa, że przy wykorzystaniu małego współczynnika  uczenia, uczenie zakończy się w optimum globalnym

 

 

Pytanie 51

Jednym z problemów z zastosowaniem funkcji sigmoidalnej (logistycznej) jest jej nasycenie dla dużych i malych wartości   Czy zastosowanie funkcji tangensa hiperbolicznego jako funkcji aktywacji pozwala uniknąć tego problemu?

PRAWDA

Fałsz

  1. Główne ograniczenie metody propagacji wstecznej to:

    Wybierz wszystkie poprawne:

    1. Wolna zbieżność
    2. Minimuma lokalne

     

    Które ze stwierdzeń odnośnie inicjalizacji wag jest FAŁSZEM?

    1. początkowo najlepiej wszystkie wagi ustawić na 0

     

    Które z podanych stwierdzeń dotyczących uczenia metodą SGD na małych paczkach (mini batch SGD) jest FAŁSZEM?

    1. efekt działania tej metody jest identyczny z SGD (stochastic gradient)

     

    Dlaczego nie powinniśmy inicjalizować wag ustawiając je wszystkie=0

    1. a) mamy zjawisko zanikającego gradientu w sieci”

     

    Propagacja wsteczna to technika uczenia sieci neuronowych. Określ co rzutuje się wstecz  zaznaczając właściwą odpowiedź.

    1. Gradient błędu

     

    Określ w jaki sposób rzutowane są gradienty błędów w metodzie propagacji wstecznej w celu aktualizacji wag

    1. od warstwy wyjściowej do ukrytej

     

    Które z podanych czynników tworzą nieliniową naturę sieci neuronowych?

    1. funkcje aktywacji.

     

    Dobór początkowej wartości  współczynnika uczenia przy użyciu optymalizacji współczynnika uczenia nie ma wpływu na szybkość uczenia modelu. Prawda czy fałsz?

    Fałsz

     

    Zadanie klasyfikacji i regresji musi być wykonywane przy użyciu odpowiedniej funkcji straty (kosztu) . Wybierz właściwe funkcje dla obu zadań sposród propozycji podanych poniżej.

    1. dla zadania regresji błąd średniokwadratowy, a dla zadania klasyfikacji entropia krzyżowa.

     

    Jednym z problemów z zastosowaniem funkcji sigmoidalnej (logistycznej) jest jej nasycenie dla dużych i malych wartości.  Czy zastosowanie funkcji tangensa hiperbolicznego jako funkcji aktywacji pozwala uniknąć tego problemu?

    Fałsz

     

    Czym jest funkcja kosztu?

    1. funkcja określająca jak dobrze model funkcjonuje przy danych wartościach parametrów

     

    Zaznacz te elementy, spośród wymienionych, które wpływają na szybkość uczenia

    1. użyta funkcja aktywacji
    2. wartości początkowych wag
    3. wartość współczynnika uczenia

     

    Uczenie sieci przez zbyt dużą liczbę epok prowadzi do (zaznacz właściwe odpowiedzi):

    1. niepotrzebnej straty czasu
    2. przeuczenia

     

    Liczba wag (nie licząc biasów) w sieci MLP w pełni połączonej o 5 neuronach w warstwie wejściowej i 5 neuronach w warstwie ukrytej oraz 3 warstwie wyjściowej wynosi :

    1. 40

     

    Które z podanych niżej funkcji NIE mogą być stosowane w sieci MLP uczonej metodą propagacji wstecznej?

    1. funkcja progowa

     

    Które ze stwierdzeń najlepiej definiuje pojęcie generalizacji w odniesieniu do sieci neuronowych:

    1. zdolność do wyuczenia się funkcji odwzorowującej dane wejściowe na wyjściowe

     

    Jaki jest cel użycia regularyzacji L1 i L2 w sieciach neuronowych?

    1. poprawa generalizacji

     

    Skalujemy wejścia sieci neuronowej, żeby poprawić zbieżność i przyspieszyć proces uczenia.

    Prawda

     

    EDA to eksploracyjna analiza danych. Zaznacz techniki jakie są w niej wykorzystywane.

    1. Podejście statystyczne
    2. Metody wizualizacji

     

    Które funkcje straty są używane w zadaniu regresji?

    1. błąd sredniokwadratowy
    2. średni błąd bezwględny

     

    Które ze stwierdzeń jest PRAWDZIWE?

    1. funkcja softmax jest używana w warstwie wyjściowej, funkcja sigmoidalna w warstwie ukrytej

     

    Poniżej przedstawiona jest charakterystyka regresji logistycznej. Zaznacz stwierdzenia PRAWDZIWE.

    1. Funkcja dopasowania to entropia krzyżowa.
    2. Wyjście reprezentuje prawdopodobieństwo przynależności do klasy.
    3. Do modelowania prawdopodobieństwa w regresji binarnej stosowana jest funkcja sigmoidalna

     

     

     

    Budujemy klasyfikator wykorzystujący sieć w pełni połączoną. Zadanie do rozwiązania przez sieć polega na tym, żeby znaleźć zdjęcia zawierające legwana lub niedźwiedzia (może być tylko jedno zwierzę na zdjęciu, ale mogą też być oba), tzn.  sieć powinna klasyfikować obraz jako niezawierający tych zwierząt  lub zawierający wymienione zwierzęta  niezależnie od tego ile zwierząt z każdego z wymienionych gatunków jest na zdjęciu.  Jakie zadanie maszynowego uczenia model będzie realizować?

    1. klasyfikację wieloetykietową

     

    Które z tych stwierdzeń jest FAŁSZEM?

    1. Korzystajac z zaimplementowanego modelu sieci, niezależnie od wartości początkowych wag, sieć zawsze wyuczy się określonego zadania