Seminarium Dyplomowe 🇵🇱

Studia inżynierskie, Inżynieria i Analiza Danych (Data Science), Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej

Celem przedmiotu jest przygotowanie Was do obrony (świetnej) pracy dyplomowej inżynierskiej i zaliczenia (bardzo dobrze) egzaminu dyplomowego.

Harmonogram – Semestr zimowy 2024/2025

Grupa I: Wtorki 16:15–18:00, 314 MiNI

Tydzień

Data

Temat

1

2024-10-08

  • Wprowadzenie

2

2024-10-15

  1. Zagadnienia zarządzania ryzykiem w projekcie (Viktoriia Kyryk)

  2. Etapy procesu wytwarzania oprogramowania (Paweł Świderski)

  3. Sieć Kohonena: topologia, uczenie, zastosowania (Tymoteusz Kwieciński)

  4. Wzorce projektowe (Rafał Pyzowski)

  5. Rozkłady macierzy na czynniki i ich zastosowania (Mateusz Wiktorzak)

  6. Wyzwania programowania równoległego (Michaił Legczylin)

3

2024-10-22

  1. Podział i charakterystyka metod uczenia maszynowego (nadzorowane i nienadzorowane) (Marta Szuwarska)

  2. Przetwarzanie transakcyjne w bazach danych (Michał Chęć)

  3. Metody selekcji zmiennych w zadaniach klasyfikacji i regresji (Wojciech Grabias)

  4. Rozkłady prawdopodobieństwa i ich charakterystyki (Jakub Jung)

  5. Warunki konieczne optymalności dla zadań z ograniczeniami (Karolina Mączka)

  6. Właściwości algorytmów sortujących (złożoność, stabilność, dolne ograniczenia złożoności) (Jakub Grzywaczewski)

  7. Charakterystyka modeli drzewiastych (drzewa, lasy, itd.) (Michał Geneja)

  8. Metody regresyjne dla odpowiedzi binarnej (Aleksandra Kulczycka←18 – ew. o 18?)

4

2024-10-29

  1. Grafy planarne - podstawowe własności i twierdzenia ich dotyczące (Martyna Kuśmierz)

  2. Problem najtańszego drzewa rozpinającego w grafie (Aleks Kapich)

  3. Wzorzec architektury mikro-usługowej (ang. microservices) (Krzysztof Sawicki)

  4. TCP vs UDP - krótka charakterystyka porównawcza (Zuzanna Piróg)

  5. Zadanie interpolacji. Zastosowania interpolacji (Maciej Borkowski)

  6. Wektory losowe - rozkłady łączne i brzegowe, niezależność, korelacja i kowariancja (Łukasz Lepianka)

  7. Wyrażenie lambda i interfejsy funkcyjne (Natalia Safiejko)

  8. Zasady w doborze kolorów na wykresach, teoria znaku, rodzaje skal, defekty w widzeniu barw (Mateusz Nizwantowski←18)

5

2024-11-05

  1. Bazy relacyjne, hurtownie danych, platformy Big Data, platformy NoSQL – podobieństwa, różnice, zastosowania (Łukasz Grabarski)

  2. Metody estymacji nieznanych parametrów rozkładów zmiennych losowych: podstawowe własności estymatorów i metody konstrukcji estymatorów (Alicja Charuza)

  3. Pojęcie złożoności obliczeniowej. Notacje (Barbara Jurzysta)

  4. Wzorce architektoniczne Lambda i Kappa (Kamil Kisiel)

  5. Protokół HTTP i usługi w modelu REST (Agata Osmałek←18)

6

2024-11-12

  • (grupa I - prezentacja I) Kamil Kisiel, Michał Chęć

  • (grupa III - prezentacja I) Krzysztof Sawicki, Wojciech Grabias

7

2024-11-19

  • (grupa II - prezentacja I) Rafał Pyzowski, Jakub Jung

  • (grupa IV - prezentacja I) Jakub Lange, Aleks Kapich

  • (grupa V - prezentacja I) Barbara Jurzysta, Viktoriia Kyryk

  • (grupa VI - prezentacja I) Karolina Mączka, Łukasz Lepianka

8

2024-11-26

  • (grupa VII - prezentacja I) Alicja Charuza, Martyna Kuśmierz

  • (grupa VIII - prezentacja I) Marta Szuwarska, Łukasz Grabarski

  • (grupa IX - prezentacja I) Tymoteusz Kwieciński, Mateusz Nizwantowski, Jakub Grzywaczewski

  • (grupa X - prezentacja I) Natalia Safiejko, Zuzanna Piróg

9

2024-12-03

  • (grupa XI - prezentacja I) Paweł Świderski, Kacper Wnęk

  • (grupa XII - prezentacja I) Maciej Borkowski

  • (grupa XIII - prezentacja I) Agata Osmałek, Aleksandra Kulczycka, Michaił Legczylin

oraz:

  1. Struktury danych do implementacji kolejek priorytetowych i słowników (Jakub Lange)

10

2024-12-10

11

2024-12-17

  • (grupa I - prezentacja II)

  • (grupa II - prezentacja II)

  • (grupa III - prezentacja II)

12

2025-01-07

  • (grupa IV - prezentacja II)

  • (grupa V - prezentacja II)

  • (grupa VI - prezentacja II)

13

2025-01-14

  • (grupa VII - prezentacja II)

  • (grupa VIII - prezentacja II)

  • (grupa IX - prezentacja II)

  • (grupa X - prezentacja II)

14

2025-01-21

  • (grupa XI - prezentacja II)

  • (grupa XII - prezentacja II)

  • (grupa XIII - prezentacja II)

15

2025-01-28

  • (TBA)

Grupa II: Wtorki 18:15–20:00, 314 MiNI

Tydzień

Data

Temat

1

2024-10-08

  • Wprowadzenie

2

2024-10-15

(niektóre tematy są wolne – jeśli ktoś chiałby opracować dwa pytania, to śmiało!)

  1. Metoda Newtona rozwiązywania zadań optymalizacji bez ograniczeń (Michał Matejczuk)

  2. Obciążenie a wariancja modeli uczenia maszynowego, przykłady (Sebastian Trojan)

  3. Metody estymacji i testowania w modelu liniowym (Piotr Kosakowski)

  4. Zagadnienia zarządzania jakością, normy i standardy w organizacji (Cezary Rybak)

  5. Prezentacja wartości pomysłu biznesowego (np. Business Model Canvas) (Jakub Rymarski)

  6. Model referencyjny OSI (Wiktor Woźniak)

  7. Programowanie generyczne (Wiktoria Koniecko)

3

2024-10-22

  1. Typowe błędy w wizualizacji danych (Tymoteusz Urban)

  2. Paradygmaty programowania obiektowego (Jakub Sawicki)

  3. Paradygmaty i założenia projektowe systemów Unix (Jakub Seliga)

  4. Zadania systemu operacyjnego. Standardy POSIX i SUS (Gleb Grinchik)

  5. Metody gradientów sprzężonych (Mateusz Andryszak←16)

  6. Idea i przykłady algorytmów ewolucyjnych (Aleksandra Kulczycka vol. 2)

4

2024-10-29

  1. Perceptron wielowarstwowy: topologia, uczenie gradientowe, zastosowania (Franciszek Szczepaniak)

  2. Twierdzenia graniczne rachunku prawdopodobieństwa (Michał Binda)

  3. Zadaniowe zarządzanie projektem (np. Kanban) (Wiktor Wierzchowski)

  4. Analiza rynku i analiza konkurencji (Maciej Szpetmański)

  5. Weryfikacja hipotez: podstawowe pojęcia i własności testów oraz metody konstrukcji testów statystycznych (Michał Iwicki)

5

2024-11-05

  1. Estymacja przedziałowa: podstawowe pojęcia i metody konstrukcji przedziałów ufności (Magdalena Jeczeń)

  2. Skale pomiarowe, ilorazowa, przedziałowa, nominalna. Właściwości i zalecenia związane z prezentacją danych (Adrian Zaręba)

  3. Reguła SOLID w projektowaniu oprogramowania (Mikołaj Mróz)

  4. Spójność grafów – podstawowe pojęcia, twierdzenie Mengera (Wojciech Michaluk)

  5. Testowanie oprogramowania: klasyfikacja i dobre praktyki (Krzysztof Kosz←16)

  6. Zwinne metodyki wytwarzania oprogramowania: wartości, praktyki, procesy i artefakty (Mateusz Kubita←16)

  7. Najważniejsze pojęcia związane z dokładnością obliczeń numerycznych (—)

  8. Oprogramowanie FLOSS, oprogramowanie wolne i otwarte (—)

  9. Relacyjne bazy danych (—)

  10. Architektura oparta na zdarzeniach (ang. Event-Driven Architecture) (—)

  11. Wzorzec MVC (ang. model, view, controller) (—)

  12. Klasy wewnętrzne i anonimowe (—)

  13. Język SQL i przetwarzanie transakcyjne w platformach Big Data: podobieństwa i różnice w obsługiwanych dialektach w stosunku do platform RDBMS na przykładzie wybranej platformy Big Data (—)

6

2024-11-12

  • (grupa I - prezentacja I) Michał Iwicki, Magdalena Jeczeń

  • (grupa II - prezentacja I) Mateusz Andryszak, Krzysztof Kosz, Jakub Rymarski

  • (grupa III - prezentacja I) Wiktor Wierzchowski, Adrian Zaręba

7

2024-11-19

  • (grupa IV - prezentacja I) Wiktoria Koniecko, Gleb Grichnik

  • (grupa V - prezentacja I) Jakub Seliga, Cezary Rybak

  • (grupa VI - prezentacja I) Mikołaj Mróz, Michał Binda

oraz:

  1. Organizacja i metody składowania danych oraz metadanych w platformach Big Data: pliki, hurtownia danych, kolumnowe platformy NoSQL (Kacper Wnęk)

8

2024-11-26

  • (grupa VII - prezentacja I) Mateusz Kubita, Wojciech Michaluk, Tymoteusz Urban

  • (grupa VIII - prezentacja I) Franciszek Szczepaniak , Mateusz Wiktorzak

  • (grupa IX - prezentacja I) Piotr Kosakowski, Michał Matejczuk

9

2024-12-03

  • (grupa X - prezentacja I) Sebastian Trojan, Wiktor Woźniak

  • (grupa XI - prezentacja I) Maciej Szpetmański, Jakub Sawicki

10

2024-12-10

11

2024-12-17

  • (grupa I - prezentacja II)

  • (grupa II - prezentacja II)

  • (grupa III - prezentacja II)

12

2025-01-07

  • (grupa IV - prezentacja II)

  • (grupa V - prezentacja II)

  • (grupa VI - prezentacja II)

13

2025-01-14

  • (grupa VII - prezentacja II)

  • (grupa VIII - prezentacja II)

  • (grupa IX - prezentacja II)

14

2025-01-21

  • (grupa X - prezentacja II)

  • (grupa XI - prezentacja II)

15

2025-01-28

(TBA)

Regulamin i zasady zaliczenia

W pierwszej części semestru (tygodnie II-V) temat referatu jest określany przez Prowadzącego – obejmuje zakres szeroko rozumianej inżynierii i analizy danych. Prezentacja odbywa się tylko przy użyciu tablicy (jak na egzaminie dyplomowym) – bez własnych notatek, bez slajdów. Odpowiedzi są indywidualne (ok. 5 min. na temat + dyskusja).

W drugiej i trzeciej części semestru (tygodnie VI-X i XI-XV) każda grupa projektowa (2–3 osobowa) przedstawia referaty (slajdy; ok. 10–12 min. każdy), po których następuje krótka dyskusja (pytania z sali itp.). Referaty dotyczą realizowanych prac dyplomowych. Studenci przedstawiają:

  • ramowy zakres pracy,

  • uzasadnienie wyboru tematu,

  • przegląd literatury związanej z tematyką pracy,

  • osiągnięte oraz planowane rezultaty,

  • przewidywane problemy,

  • podział obowiązków wśród członków zespołu,

  • pomysły na przyszłe badania/rozwijanie tematu,

  • itp.

Studenci za każdym razem pokazują także aktualną wersję PDF pracy (celem oceny stopnia jej zaawansowania).

Każdy z referatów jest oceniany w skali od 0 do 5 punktów. Ocena zależy m.in. od jakości wygłoszonego referatu, utrzymania wyznaczonych ram czasowych oraz stopnia zaawansowania pracy z uwzględnieniem harmonogramu.

Ostateczną oceną jest zaokrąglona do najbliższej 0,5-ki średnia arytmetyczna z uzyskanych punktów.

Za każdą nieusprawiedliwioną (np. formalnym zaświadczeniem lekarskim) nieobecność obniża się ocenę końcową o 0,25 pkt. Szanujmy siebie nawzajem: skoro kolega lub koleżanka słucha naszej prezentacji, to i my słuchamy ich. Niewygłoszenie referatu jest równoznaczne z przyznaniem 0 punktów (zero).

Dodatkowe informacje

Szczegółowe informacje na temat realizacji pracy zostały podane na pierwszych zajęciach.

Redakcja pracy

Język: akademicki, a nie korporacyjny żargon.

Styl: raczej formalny.

Bibliografia

  • Preferujemy cytowanie dobrych książek i czasopism, a nie informacji ze stron internetowych (np. blogów czy Wikipedii, choć mogą być one punktem wyjścia do przeglądu literaturowego).

  • Przeglądu literatury dokonujemy z należytą starannością. ChatGPT lub podobne (np. automatycznie generowane podsumowania w wyszukiwarce G**gle) zwracają niewiarogodne wyniki. Sugerujemy zapoznanie się z bazą Google Scholar lub Scopus.

  • Dostęp do większości czasopism mamy z sieci PW za darmo. Jeśli nie, to preprinty większości artykułów można znaleźć dość łatwo np. na ArXiVie.

  • Unikamy materiałów z kiepskich konferencji oraz tzw. predatory journals, choć i tam znaleźć się mogą perły (tak jak w tzw. renomowanych czasopismach jest wiele śmieci). Zawsze podchodzimy krytycznie do tego, co czytamy.

  • Bibliografię formatujemy przy użyciu BibTeXa lub Bibera, nigdy ręcznie. Formatowanie bibliografii powinno być spójne.

Samodzielność i poprawność pracy

Odpowiadacie za całość treści pracy, w tym jej poprawność merytoryczną.

Prace będą przetwarzane przez system antyplagiatowy.

Nie generujemy/streszczamy/parafrazujemy tekstu pracy, kodu i prezentacji przy użyciu narzędzi informatycznych (GenAI w tym LLM typu ChatGPT, Llama, Copilot itp.). Miejmy swój styl. Chcemy, byście wyrośli na niezależnych ekspertów, których nie zastąpi tzw. AI. Uwaga: wysyłając pracę, składacie oświadczenie że została ona napisana samodzielnie oraz że nie narusza ona praw autorskich.

Świadomy(a) odpowiedzialności karnej za składanie fałszywych zeznań oświadczam, że niniejsza praca dyplomowa została napisana przeze mnie samodzielnie, pod opieką kierującego pracą dyplomową.

Jednocześnie oświadczam, że:

  • niniejsza praca dyplomowa nie narusza praw autorskich w rozumieniu ustawy z dnia 4 lutego 1994 roku o prawie autorskim i prawach pokrewnych (Dz.U. z 2021 r., poz. 1062) oraz dóbr osobistych chronionych prawem cywilnym,

  • niniejsza praca dyplomowa nie zawiera danych i informacji, które uzyskałem(am) w sposób niedozwolony,

  • niniejsza praca dyplomowa nie była wcześniej podstawą żadnej innej urzędowej procedury związanej z nadawaniem dyplomów lub tytułów zawodowych,

  • wszystkie informacje umieszczone w niniejszej pracy, uzyskane ze źródeł pisanych i elektronicznych, zostały udokumentowane w wykazie literatury odpowiednimi odnośnikami,

  • znam regulacje prawne Politechniki Warszawskiej w sprawie zarządzania prawami autorskimi i prawami pokrewnymi, prawami własności przemysłowej oraz zasadami komercjalizacji.

Ponadto składacie osobne oświadczenie dotyczące użycia GenAI.