Pytanie 1
które funkcje straty są używane w zadaniu regresji?
wybierz wszystkie poprawne:
a Binarna entropia krzyżowa
B średni błąd bezwzględny
C błąd sredniokwadratowy
Pytanie 2
Jednym z problemów z zastosowaniem funkcji sigmoidalnej (logistycznej) jest jej nasycenie
dla dużych i malych wartości Czy zastosowanie funkcji tangensa hiperbolicznego jako
funkcji aktywacji pozwala uniknąć tego problemu?
Wybierz jedną odpowiedź:
Prawda
FAŁSZ
Pytanie 3
Główne ograniczenie metody propagacji wstecznej to:
Wybierz wszystkie poprawne:
A wolna zbieżność?
B minimuma lokalne?
C skalowalność?
Pytanie 4
Dobór początkowej wartości współczynnika uczenia przy użyciu optymalizacji współczynnika
uczenia nie ma wpływu na szybkość uczenia modelu Prawda czy fałsz?
Wybierz jedną odpowiedź:
Prawda
FAŁSZ
Pytanie 5
Czym jest funkcja kosztu?
a inna nazwa dla funkcji aktywacji
B funkcja określająca jak dobrze model funkcjonuje przy danych wartościach
parametrów
c metoda używana do znalezienia minimum funkcji
d funkcja opisująca jak bardzo złożona obliczeniowo jest sieć
Pytanie 6
Eksploracyjna analiza danych (EDA) powinna być krokiem wstępnym przed użyciem metody
maszynowego uczenia Poniżej zamieszczono na jej temat kilka stwierdzeń Zaznacz to,
które jest Twoim zdaniem NIEPRAWDZIWE
a Podsumowuje charakterystykę danych
b Używa metod wizualizacji danych
C Dostarcza informacji o dokładności rozpoznawania dla modelu wyuczonego na tych
danych
Pytanie 7
Zaznacz te elementy, spośród wymienionych, które wpływają na szybkość uczenia
Wybierz wszystkie poprawne:
A wartość początkowych wag
B liczba użytych neuronów w sieci
C użyta funkcja aktywacji
D wartość współczynnika uczenia
Pytanie 8
Mamy zamodelować szansę przeżycia pacjentki z rakiem piersi na podstawie jej wieku i
rozmiaru guza Jaki rodzaj modelu proponowałbyś użyć? Szansę nalezy rozumieć jako
ocenę czy przeżyje 5 lat czy nie Zaznacz właściwe
a Regresja liniowa
B Regresja logistyczna
Pytanie 9
Zidentyfikuj funkcję aktywacji, która zapisana jest następującym wzorem (X-wektor wejść, V
– wektor wag, b-bias)
(V) – 1/ (1 + exp ^(-1)( X * V + b) ), znak ^ oznacza podniesienie do potęgi
a funkcja ReLU
b Funkcja Gaussa
C funkcja sigmoidalna
d Funkcja skokowa
Pytanie 10
Które z podanych niżej funkcji NIE mogą być stosowane w sieci MLP uczonej metodą
propagacji wstecznej?
A funkcja progowa
b funkcja tożsamościowa
c funkcja sigmoidalna
d funkcja softmax
Pytanie 11
Które z podanych stwierdzeń dotyczących uczenia metodą SGD na małych paczkach (mini
batch SGD) jest FAŁSZEM?
A efekt działania tej metody jest identyczny z SGD (stochastic gradient)
b aktualizacja wag wykonuje się na pojedynczej paczce wzorców
c rozmiar paczki (batch size) jest hiperparametrem, który jest dostrajany
Pytanie 12
Które ze stwierdzeń najlepiej definiuje pojęcie generalizacji w odniesieniu do sieci
neuronowych:
a zdolność do zapamiętywania wzorców
b zdolność do przetwarzania wzorców
C zdolność do wyuczenia się funkcji odwzorowującej dane wejściowe na wyjściowe
Pytanie 13
Określ w jaki sposób rzutowane są gradienty błędów w metodzie propagacji wstecznej w
celu aktualizacji wag
a od warstwy wyjściowej do ukrytej
b Od warstwy wejściowej do wyjściowej
c Od warstwy wejściowej do ukrytej
D od warstwy wyjściowej do wejściowej
Pytanie 14
Skalujemy wejścia sieci neuronowej, żeby poprawić zbieżność i przyspieszyć proces
uczenia
Wybierz jedną odpowiedź:
PRAWDA
Fałsz
Pytanie 15
Liczba wag (nie licząc biasów) w sieci MLP w pełni połączonej o 5 neuronach w warstwie
wejściowej i 5 neuronach w warstwie ukrytej oraz 3 warstwie wyjściowej wynosi:
a 75
b 28
C 40
d 13
e
Pytanie 16
Skąd bierze się termin naiwny w naiwnym klasyfikatorze Bayesa
A Bo robimy założenie o warunkowej niezależności zmiennych wejściowych względem
klasy
b Bo Bayes wykazał się naiwnością
c Bo stosujemy wzór Bayesa w uproszczonej formie
Pytanie 17
Propagacja wsteczna to technika uczenia sieci neuronowych Określ co rzutuje się wstecz
zaznaczając właściwą odpowiedź
a Zmiany wag
B Gradient błędu
Pytanie 18
Budujemy klasyfikator wykorzystujący sieć w pełni połączoną Zadanie do rozwiązania przez
sieć polega na tym, żeby znaleźć zdjęcia zawierające legwana lub niedźwiedzia (może być
tylko jedno zwierzę na zdjęciu, ale mogą też być oba), tzn sieć powinna klasyfikować obraz
jako niezawierający tych zwierząt lub zawierający wymienione zwierzęta niezależnie od tego
ile zwierząt z każdego z wymienionych gatunków jest na zdjęciu Jakie zadanie
maszynowego uczenia model będzie realizować?
a klasyfikacje binarną
b klasyfikacje wieloklasową
C klasyfikacje wieloetykietową
Pytanie 19
Jaką odpowiedź zwróci neuron pokazany na poniższym rysunku dla wartości wejść x1=1
x2=1 i wag w0=0,2, w1=-0,7 w2=0,8? Zakładamy, że funkcja skoku występuje w 0
Poprawna odpowiedź to: 1
Pytanie 20
Które z tych stwierdzeń jest FAŁSZEM?
a Wartości początkowych wag sieci mogą wydłużać proces uczenia
b Wartości początkowych wag, wpływają na skuteczność wyuczenia sieci
C Korzystając z zaimplementowanego modelu sieci, niezależnie od wartości
początkowych wag, sieć zawsze wyuczy się określonego zadania
Pytanie 21
Które z podanych czynników tworzą nieliniową naturę sieci neuronowych?
a warstwy ukryte
b Regularyzacja
c Wagi i biasy
D funkcje aktywacji
Pytanie 22
Uczenie sieci przez zbyt dużą liczbę epok prowadzi do (zaznacz właściwe odpowiedzi):
Wybierz wszystkie poprawne:
A długiego czasu uczenia
B przeuczenia
C niepotrzebnej straty czasu
Pytanie 23
EDA to eksploracyjna analiza danych Zaznacz techniki jakie są w niej wykorzystywane
Wybierz wszystkie poprawne:
A Podejście statystyczne
B Metody wizualizacji
c Metody do analizy zastosowanego modelu
Pytanie 24
Jaki jest cel użycia regularyzacji L1 i L2 w sieciach neuronowych?
A poprawa generalizacji
b unikanie zanikającego gradientu
c unikanie wybuchającego gradientu
Pytanie 25
Zadanie klasyfikacji i regresji musi być wykonywane przy użyciu odpowiedniej funkcji straty
(kosztu) Wybierz właściwe funkcje dla obu zadań spośród propozycji podanych poniżej
A Dla zadania regresji błąd średniokwadratowy a dla zadania klasyfikacji entropia
krzyżowa
b Dla zadania regresji entropia krzyżowa, dla zadania klasyfikacji entropia binarna
c Dla klasyfikacji funkcja logistyczna, dla zadania regresji funkcja logistyczna
Pytanie 26
Poniżej przedstawiona jest charakterystyka regresji logicznej
Zaznacz stwierdzenia PRAWDZIWE
Wybierz wszystkie poprawne:
A Funkcja dopasowania to entropia krzyżowa
b Zmienna zależna powinna być ciągła
C Do modelowania prawdopodobieństwa w regresji binarnej stosowana jest funkcja
sigmoidalna
Pytanie 27
Załóżmy, że neuron otrzymuje n wejść x1, x2, x3…… xn na połączeniach z wagami w1,
w2, wn Całkowite pobudzenie przesyłanie do funkcji aktywacji wyraża się wzorem:
a Σ wi + Σ xi
b Σ xi
c Σ wi
D Σ wi*xi
Pytanie 28
Dlaczego nie powinniśmy inicjalizować wag ustawiając je wszystkie=0
A w takiej sytuacji wszystkie neurony ukryte mają ten sam gradient
b mamy zjawisko zanikającego gradientu w sieci
c występuje zjawisko przeuczenia się sieci
Pytanie 29
Które ze stwierdzeń jest PRAWDZIWE?
A funkcja softmax jest używana w warstwie wyjściowej, funkcja sigmoidalna w warstwie
ukrytej
b funkcja softmax jest używana w warstwie ukrytej, funkcja sigmoidalna w warstwie
wyjściowej
c softmax jest zazwyczaj używana dla problemów binarnej klasyfikacji
d żadna odpowiedź nie jest prawidłowa
Pytanie 30
Które ze stwierdzeń odnośnie inicjalizacji wag jest FAŁSZEM?
A początkowo najlepiej wszystkie wagi ustawić na 0
b czas trenowania sieci może się wydłużyć z powodu złej inicjalizacji wag
c z powodu złej inicjacji wag może się pojawić problem znikającego lub
eksplodującego gradientu
Pytanie 31
Co to jest funkcja aktywacji
A funkcja umożliwiająca sieci rozwiązać nieliniowe problemy
b sposób okreslenia jak dobrze model funkcjonuje przy danych wartosciach parametrow
c funkcja opisujaca zlozonosc sieci neuronowej
d algorytm opltymalizacji sluzacy do znalezienia parametrow (wspolczynnikow) funkcji minimalizującej funkcję kosztu
Pytanie 32
Jakie elementy wpływają na optymalizację współczynnika uczenia we współczesnych implementacjach sieci neuronowych (optymalizatory współczynnika uczenia)?
A Wartość aktualnego gradientu
B zdyskontowana suma poprzednich gradientów
C krok uczenia
Pytanie 33
Dokładność wyuczenia modelu nie poprawia się przez wiele epok Co może być przyczyną takiej sytuacji? Zaznacz właściwą odpowiedź
A dobór hiperparametrów
B źle dobrana funkcja straty
C dane trenujące
D architektura sieci
Pytanie 34
Czym jest operacja podziału (splitting) w drzewie decyzyjnym?
a Wszystkie wymienione odpowiedzi są prawdziwe
b Usunięciem podwęzła (węzła potomnego) w drzewie
C Stworzenie dwóch lub więcej węzłów potomnych danego węzła
d Balansowaniem zbioru danych przed uczenieniem
Pytanie 35
Które ze stwierdzeń o funkcji kosztu są FAŁSZYWE?
a kodowanie wartości wyjściowych w postaci „1 z n” jest wymagane dla entropii krzyżowej
b błąd średniokwadratowy jest zazwyczaj używany w problemach regresji
C Żadne z wymienionych
d funkcja entropii krzyżowej może być stosowana zarówno w problemach binarnej klasyfikacji, jak i klasyfikacji wieloklasowej
Pytanie 36 (może być/nie musi wiecej porawnych – C jest na pewno zle)
Mamy do rozwiązania problem Należy użyć modelu do predykcji ceny dolara w zależności od cen innych walut (funt, euro) oraz inflacji Wybierz odpowiednie według Ciebie podejścia
A regresja liniowa z funkcją straty w postaci błędu średniokwadratowego
b regresja logistyczna z funkcją straty w postacie entropii krzyżowej
c Sieć MLP z funkcją straty jako entropią krzyżową
d Sieć MLP z funkcją straty w postaci błędu średniokwadratowego
Pytanie 37
W jaki sposób powinny być zakodowane wejścia sieci neuronowej biorąc pod uwagę typ wartości cechy podawanej na wejście
Jak powinny być wstępnie przetworzone wartości cech będące wartościami rzeczywistymi?
powinno się przeprowadzic skalowanie/ normalizację
Jak powinny być wstępnie reprezentowane cechy będące wartościami nominalnymi?
powinny być zakodowane 1 z n
Jak powinny być wstępnie przetworzone wejścia dla wartości binarnych
nie powinniśmy przeprowadzać wstępnego przetwarzania danych
Pytanie 38
Do rozwiązywania jakich zadań mozna wykorzystywać sieci uczone metodą propagacji wstecznej?
a klasyfikacji
B wszystkich wymienionych w pozostałych punktach
c regresji
d rozpoznawania wzorców
Pytanie 39
Które z podanych stwierdzeń o momentum jest PRAWDZIWE? Momentum
A wpływa na kierunek gradientu w metodzie SGD
B Pomaga w szybszej zbieżności uczenia
C Pomaga SGD unikać lokalnych minimów
Pytanie 40
Skalujemy wejścia sieci neuronowej, żeby poprawić zbieżność i przyspieszyć proces uczenia
PRAWDA
Fałsz
Pytanie 41 (JEST WIECEJ POPRAWNYCH ODPOWIEDZI)
Co się stanie jesli zainicjowane wagi będą bardzo duże?
a nie ma to znaczenia
B może wystapić zjawisko zainikającego gradientu
c może wystapić zjawisko wybuchającego gradientu
Pytanie 42
Które z tych stwierdzeń jest FAŁSZEM?
a Wartości początkowych wag sieci mogą wydłużać proces uczenia
B Korzystajac z zaimplementowanego modelu sieci, niezależnie od wartości początkowych wag, sieć zawsze wyuczy się określonego zadania
c Wartości początkowych wag, wpływają na skuteczność wyuczenia sieci
Pytanie 43
Przyjmijmy, że rozważamy neuron o trzech wejściach z wektorem wag [0 2 -0 1 0 1]^T i biasem θ = 0 Jeśli wektor wejściowy x = [0 2 0 4 0 2]^T jest podawany na wejście , to całkowite pobudzenie jest równe:
a 0 20
B 0,02
c 1
d -1
Pytanie 43
Które z podanych stwierdzeń dotyczących uczenia metodą SGD na małych paczkach (mini batch SGD) jest FAŁSZEM?
A efekt działania tej metody jest identyczny z SGD (stochastic gradient)
b rozmiar paczki (batch size) jest hiperparametrem, który jest dostrajany
c aktualizacja wag wykonuje się na pojedynczej paczce wzorców
Pytanie 44 (IDK KTÓRA ODPOWIEDZ- NA PEWNO NIE A)
Jaki jest cel stosowania funkcji aktywacji w sieciach neuronowych?
a Aby znormalizować wejścia
b Aby zwiększyć głębokość sieci
c Aby utworzyć połączenia między warstwami
D Aby wprowadzić nieliniowość w neuronie
Pytanie 45 (IDK KTÓRA ODPOWIEDZ- NA PEWNO NIE B)
W drzewie decyzjnym entropia pomaga wyznaczyć cechę albo atrybut, który daje maksimum informacji na temat klasy Jak nazywa się ta miara? Wybierz właściwą odpowiedź
A Zysk informacyjny
b Pruning
c Długość ścieżki
d Indeks Giniego
Pytanie 46
Zaznacz czynniki, które mają wpływ na generalizację (stopień uogólniania) w sieci MLP
A metoda zatrzymywania uczenia
B architektura sieci
C regularyzacja
D zbiór uczący
Pytanie 47 (IDK KTÓRA ODPOWIEDZ)
Które ze stwierdzeń dotyczących funcki sigmoidalnej i softmax jest PRAWDZIWE?
a żadna odpowiedź nie jest prawdziwa
b funkcja softmax jest używana w warstwie ukrytej, funkcja sigmoidalna w warstwie wyjściowej
C funkcja softmax jest używana w warstwie wyjściowej, funkcja sigmoidalna w warstwie ukrytej
d softmax jest zazwyczaj używana dla problemów binarnej klasyfikacji
Pytanie 48(IDK KTÓRA ODPOWIEDZ)
Które z podanych terminów NIE pasują do określenia funkcja straty?
a funkcja celu
b funkcja błędu
C funkcja aktywacji
d funkcja kosztu
Pytanie 49(IDK KTÓRA ODPOWIEDZ)
Poniżej przedstawiona jest charakterystyka regresji logistycznej Zaznacz stwierdzenia PRAWDZIWE
A Wyjście reprezentuje prawdopodobieństwo przynależnosci do klasy
b Funkcja dopasowania to entropia krzyżowa
c Zmienna zależna powinna być ciągła
D Do modelowania prawdopodobieństwa w regresji binarnej stosowana jest funkcja sigmoidalna
Pytanie 50(IDK KTÓRA ODPOWIEDZ JEDNA POPRAWNA)
Które z podanych stwierdzeń na temat współczynnika uczenia są FAŁSZYWE?
a Wpółczynnik uczenia określa jak szybko zmieniają się wagi i biasy w sieci neuronowej
b Niski współczynnik uczenia spowalnia proces uczenia
C Istnieje duża szansa, że przy wykorzystaniu małego współczynnika uczenia, uczenie zakończy się w optimum globalnym
Pytanie 51
Jednym z problemów z zastosowaniem funkcji sigmoidalnej (logistycznej) jest jej nasycenie dla dużych i malych wartości Czy zastosowanie funkcji tangensa hiperbolicznego jako funkcji aktywacji pozwala uniknąć tego problemu?
PRAWDA
Fałsz
Główne ograniczenie metody propagacji wstecznej to:
Wybierz wszystkie poprawne:
- Wolna zbieżność
- Minimuma lokalne
Które ze stwierdzeń odnośnie inicjalizacji wag jest FAŁSZEM?
- początkowo najlepiej wszystkie wagi ustawić na 0
Które z podanych stwierdzeń dotyczących uczenia metodą SGD na małych paczkach (mini batch SGD) jest FAŁSZEM?
- efekt działania tej metody jest identyczny z SGD (stochastic gradient)
Dlaczego nie powinniśmy inicjalizować wag ustawiając je wszystkie=0
- a) mamy zjawisko zanikającego gradientu w sieci”
Propagacja wsteczna to technika uczenia sieci neuronowych. Określ co rzutuje się wstecz zaznaczając właściwą odpowiedź.
- Gradient błędu
Określ w jaki sposób rzutowane są gradienty błędów w metodzie propagacji wstecznej w celu aktualizacji wag
- od warstwy wyjściowej do ukrytej
Które z podanych czynników tworzą nieliniową naturę sieci neuronowych?
- funkcje aktywacji.
Dobór początkowej wartości współczynnika uczenia przy użyciu optymalizacji współczynnika uczenia nie ma wpływu na szybkość uczenia modelu. Prawda czy fałsz?
Fałsz
Zadanie klasyfikacji i regresji musi być wykonywane przy użyciu odpowiedniej funkcji straty (kosztu) . Wybierz właściwe funkcje dla obu zadań sposród propozycji podanych poniżej.
- dla zadania regresji błąd średniokwadratowy, a dla zadania klasyfikacji entropia krzyżowa.
Jednym z problemów z zastosowaniem funkcji sigmoidalnej (logistycznej) jest jej nasycenie dla dużych i malych wartości. Czy zastosowanie funkcji tangensa hiperbolicznego jako funkcji aktywacji pozwala uniknąć tego problemu?
Fałsz
Czym jest funkcja kosztu?
- funkcja określająca jak dobrze model funkcjonuje przy danych wartościach parametrów
Zaznacz te elementy, spośród wymienionych, które wpływają na szybkość uczenia
- użyta funkcja aktywacji
- wartości początkowych wag
- wartość współczynnika uczenia
Uczenie sieci przez zbyt dużą liczbę epok prowadzi do (zaznacz właściwe odpowiedzi):
- niepotrzebnej straty czasu
- przeuczenia
Liczba wag (nie licząc biasów) w sieci MLP w pełni połączonej o 5 neuronach w warstwie wejściowej i 5 neuronach w warstwie ukrytej oraz 3 warstwie wyjściowej wynosi :
- 40
Które z podanych niżej funkcji NIE mogą być stosowane w sieci MLP uczonej metodą propagacji wstecznej?
- funkcja progowa
Które ze stwierdzeń najlepiej definiuje pojęcie generalizacji w odniesieniu do sieci neuronowych:
- zdolność do wyuczenia się funkcji odwzorowującej dane wejściowe na wyjściowe
Jaki jest cel użycia regularyzacji L1 i L2 w sieciach neuronowych?
- poprawa generalizacji
Skalujemy wejścia sieci neuronowej, żeby poprawić zbieżność i przyspieszyć proces uczenia.
Prawda
EDA to eksploracyjna analiza danych. Zaznacz techniki jakie są w niej wykorzystywane.
- Podejście statystyczne
- Metody wizualizacji
Które funkcje straty są używane w zadaniu regresji?
- błąd sredniokwadratowy
- średni błąd bezwględny
Które ze stwierdzeń jest PRAWDZIWE?
- funkcja softmax jest używana w warstwie wyjściowej, funkcja sigmoidalna w warstwie ukrytej
Poniżej przedstawiona jest charakterystyka regresji logistycznej. Zaznacz stwierdzenia PRAWDZIWE.
- Funkcja dopasowania to entropia krzyżowa.
- Wyjście reprezentuje prawdopodobieństwo przynależności do klasy.
- Do modelowania prawdopodobieństwa w regresji binarnej stosowana jest funkcja sigmoidalna
Budujemy klasyfikator wykorzystujący sieć w pełni połączoną. Zadanie do rozwiązania przez sieć polega na tym, żeby znaleźć zdjęcia zawierające legwana lub niedźwiedzia (może być tylko jedno zwierzę na zdjęciu, ale mogą też być oba), tzn. sieć powinna klasyfikować obraz jako niezawierający tych zwierząt lub zawierający wymienione zwierzęta niezależnie od tego ile zwierząt z każdego z wymienionych gatunków jest na zdjęciu. Jakie zadanie maszynowego uczenia model będzie realizować?
- klasyfikację wieloetykietową
Które z tych stwierdzeń jest FAŁSZEM?
- Korzystajac z zaimplementowanego modelu sieci, niezależnie od wartości początkowych wag, sieć zawsze wyuczy się określonego zadania