Seminarium dyplomowe

Studia inżynierskie, VII sem. (zimowy), Inżynieria i Analiza Danych (Data Science), Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej

Celem przedmiotu jest przygotowanie Was do obrony (świetnej) pracy dyplomowej inżynierskiej i zaliczenia (bardzo dobrze) egzaminu dyplomowego.

Harmonogram – Semestr zimowy 2025/2026

Grupa II: Poniedziałki 18:15–20:00, 213 MiNI

Tydzień

Data

Temat

1

2025-10-06

  • Wprowadzenie

2

2025-10-13

  • Tematy egzaminacyjne 1:

    • Przykłady algorytmów sortujących i ich właściwości: złożoność, stabilność, dolne ograniczenia złożoności (Gaspar Sekula)

    • Weryfikacja hipotez: podstawowe pojęcia i własności testów oraz metody konstrukcji testów statystycznych, lemat Neymana-Pearsona (Jakub Półtorak)

    • Paradygmaty programowania obiektowego. Własności i przykłady języków obiektowych (Zuzanna Sieńko)

    • Podział i charakterystyka metod uczenia maszynowego, m.in. nadzorowane vs nienadzorowane (Bogumiła Okrojek)

    • Oprogramowanie FLOSS, oprogramowanie wolne i otwarte (Kacper Rodziewicz)

3

2025-10-20

  • Tematy egzaminacyjne 2:

    • Wyrażenie lambda i interfejsy funkcyjne (Hubert Sobociński)

    • Protokół HTTP i usługi w modelu REST (Nadia Serafin)

    • Spójność grafów: Podstawowe pojęcia, twierdzenie Mengera (Igor Rudolf)

    • Metody estymacji nieznanych parametrów rozkładów zmiennych losowych: podstawowe własności estymatorów, zbalansowanie efektu obciążenia i wariancji, metody konstrukcji estymatorów (Katarzyna Rogalska)

    • Typowe błędy w wizualizacji danych. Zasady doboru kolorów na wykresach, teoria znaku, rodzaje skal, defekty w widzeniu barw (Mikołaj Rowicki)

  • Dyskusja: „Ślubuję […] strzec dobrego imienia Politechniki Warszawskiej i […] przyczyniać się do pomnażania dorobku wspólnoty uczelni Politechniki Warszawskiej”, czyli co dały nam studia na MiNI? Co to znaczy być inżynierem?

4

2025-10-27

  • Tematy egzaminacyjne 3:

    • Porównanie TCP i UDP (Aleksandra Kwiatkowska)

    • Rozkłady prawdopodobieństwa i ich charakterystyki (Małgorzata Mokwa)

    • Wzorce projektowe (Michał Piechota)

    • Metody selekcji zmiennych w zadaniach klasyfikacji i regresji (Julia Kruk)

    • Języki programowania i pakiety zorientowane na obliczenia naukowe, numeryczne i statystyczne: Charakterystyka, porównanie, główne założenia projektowe (Paweł Florek)

    • Perceptron wielowarstwowy: topologia, uczenie gradientowe, zastosowania (Adam Kaniasty)

  • Dyskusja: Social cooling, czyli jak dostęp do danych może zmieniać nasze zachowanie? Kto decyduje o tym, co jest dopuszczalne, a co nie? Polecam też obejrzeć Black Mirror S03E01: Nosedive

5

2025-11-03

  • Tematy egzaminacyjne 4:

    • Model referencyjny OSI (Filip Langiewicz)

    • Pojęcie złożoności obliczeniowej. Notacje. Przykłady algorytmów o różnej złożoności obliczeniowej (Paweł Pozorski)

    • Przetwarzanie transakcyjne w bazach danych (Miłosz Kita)

    • Metody regresyjne dla odpowiedzi binarnej (Michał Pytel)

    • Zagadnienia zarządzania ryzykiem w projekcie (Michał Matuszyk)

    • Organizacja i metody składowania danych oraz metadanych w platformach Big Data: pliki, hurtownia danych, kolumnowe platformy NoSQL (Jakub Kaproń)

    • Klasy wewnętrzne i anonimowe (Jakub Muszyński)

  • Dyskusja: Czego zabrakło nam na studiach? Czego chcielibyśmy się jeszcze nauczyć?

6

2025-11-13 (czwartek)

  • Data Science Job Interview Questions - burza mózgów

7

2025-11-17

  • TBA

8

2025-11-24

  • Jak przygotować bibliografię? Gdzie publikują naukowcy? Z jakich baz i źródeł (nie)korzystać (predatory journals itp.)?

  • Podstawowe błędy redakcyjne

  • Wymagania formalne: Opis podziału pracy, deklaracja użycia GenAI (w wielu przypadkach zabronione!)

  • prezentacje cz. I.1:

    • Filip Langiewicz, Mikołaj Rowicki

    • Paweł Pozorski, Jakub Muszyński

9

2025-12-01

  • prezentacje cz. I.2:

    • Igor Rudolf, Kacper Rodziewicz

    • Jakub Półtorak, Michał Pytel

    • Paweł Florek, Hubert Sobociński

10

2025-12-08

  • prezentacje cz. I.3:

    • Julia Kruk, Nadia Serafin

    • Katarzyna Rogalska, Zuzanna Sieńko

    • Michał Piechota, Gaspar Sekula

11

2025-12-15

  • prezentacje cz. I.4:

    • Jakub Kaproń, Miłosz Kita, Michał Matuszyk

    • Aleksandra Kwiatkowska, Małgorzata Mokwa, Bogumiła Okrojek

12

2025-12-22

  • (konsultacje – obecność nieobowiązkowa)

13

2025-01-12

  • prezentacje cz. II.1:

    • Filip Langiewicz, Mikołaj Rowicki

    • Paweł Pozorski, Jakub Muszyński

    • Igor Rudolf, Kacper Rodziewicz

    • Jakub Półtorak, Michał Pytel

14

2025-01-19

  • prezentacje cz. II.2:

    • Paweł Florek, Hubert Sobociński

    • Julia Kruk, Nadia Serafin

    • Katarzyna Rogalska, Zuzanna Sieńko

15

2025-01-26

  • prezentacje cz. II.3:

    • Michał Piechota, Gaspar Sekula

    • Jakub Kaproń, Miłosz Kita, Michał Matuszyk

    • Aleksandra Kwiatkowska, Małgorzata Mokwa, Bogumiła Okrojek

Grupa I: Wtorki 16:15–18:00, 313 MiNI

Tydzień

Data

Temat

1

2025-10-07

  • Wprowadzenie

2

2025-10-14

  • Tematy egzaminacyjne 1:

    • Przykłady algorytmów sortujących i ich właściwości: złożoność, stabilność, dolne ograniczenia złożoności (Natalia Choszczyk)

    • Weryfikacja hipotez: podstawowe pojęcia i własności testów oraz metody konstrukcji testów statystycznych, lemat Neymana-Pearsona (Hubert Kowalski)

    • Paradygmaty programowania obiektowego. Własności i przykłady języków obiektowych (Barbara Seweryn)

    • Podział i charakterystyka metod uczenia maszynowego, m.in. nadzorowane vs nienadzorowane (Jan Cwalina)

    • Oprogramowanie FLOSS, oprogramowanie wolne i otwarte (Antoni Kingston)

3

2025-10-21

  • Tematy egzaminacyjne 2:

    • Najważniejsze pojęcia związane z dokładnością obliczeń numerycznych (Igor Kołodziej)

    • Wzorzec architektury mikrousługowej (ang. microservices) (Zofia Kamińska)

    • Problem najtańszego drzewa rozpinającego w grafie (Mikołaj Guzik)

    • Charakterystyka modeli drzewiastych (drzewa, lasy, itd.). Komitety klasyfikatorów (Hubert Baraniak)

    • Relacyjne bazy danych. Przykłady implementacji. Postacie normalne (Agata Krawczyk)

    • Wzorzec MVC (ang. model, view, controller) (Mateusz Jarosz)

  • Dyskusja: „Ślubuję […] strzec dobrego imienia Politechniki Warszawskiej i […] przyczyniać się do pomnażania dorobku wspólnoty uczelni Politechniki Warszawskiej”, czyli co dały nam studia na MiNI? Co to znaczy być inżynierem?

4

2025-10-28

  • Tematy egzaminacyjne 3:

    • Prawa wielkich liczb i twierdzenia graniczne rachunku prawdopodobieństwa (Miłosz Chodań)

    • Zagadnienia zarządzania jakością, normy i standardy w organizacji (Bartłomiej Borycki)

    • Metoda Newtona rozwiązywania zadań optymalizacji bez ograniczeń (Norbert Frydrysiak)

    • Wyzwania programowania równoległego (Bartosz Jezierski)

    • Wyrażenia regularne. Narzędzia do przetwarzania danych tekstowych (Mateusz Deptuch)

  • Dyskusja: Social cooling, czyli jak dostęp do danych może zmieniać nasze zachowanie? Kto decyduje o tym, co jest dopuszczalne, a co nie? Polecam też obejrzeć Black Mirror S03E01: Nosedive

5

2025-11-04

  • Tematy egzaminacyjne 4:

    • Etapy procesu wytwarzania oprogramowania (Karolina Dunal)

    • Wybrane algorytmy analizy skupień (Michał Iwaniuk)

    • Metody estymacji i testowania w modelu liniowym (Krzysztof Adamczyk)

    • Modele szeregu czasowego. Dekompozycja niestacjonarnego procesu czasowego (Michał Wietecki)

    • Zadanie interpolacji. Zastosowania interpolacji (Felicja Warno)

    • Bazy relacyjne, hurtownie danych, platformy Big Data, platformy NoSQL: Podobieństwa, różnice, zastosowania (Mateusz Iwaniuk)

  • Dyskusja: Czego zabrakło nam na studiach? Czego chcielibyśmy się jeszcze nauczyć?

6

2025-11-18

  • Data Science Job Interview Questions - burza mózgów

7

2025-11-25

  • Jak przygotować bibliografię? Gdzie publikują naukowcy? Z jakich baz i źródeł (nie)korzystać (predatory journals itp.)?

  • Podstawowe błędy redakcyjne

  • Wymagania formalne: Opis podziału pracy, deklaracja użycia GenAI (w wielu przypadkach zabronione!)

  • prezentacje cz. I.1:

    • Zofia Kamińska, Karolina Dunal

    • Barbara Seweryn, Michał Wietecki

8

2025-12-02

  • prezentacje cz. I.2:

    • Igor Kołodziej, Mateusz Iwaniuk

    • Bartłomiej Borycki, Michał Iwaniuk

    • Norbert Frydrysiak, Antoni Kingston

9

2025-12-09

  • prezentacje cz. I.3:

    • Hubert Baraniak, Felicja Warno

    • Natalia Choszczyk, Mateusz Deptuch

    • Krzysztof Adamczyk, Agata Krawczyk

10

2025-12-16

  • prezentacje cz. I.4:

    • Jan Cwalina, Mateusz Jarosz, Bartosz Jezierski

    • Miłosz Chodań, Mikołaj Guzik

    • Adam Kaniasty, Hubert Kowalski

11

2025-12-23

  • (konsultacje – obecność nieobowiązkowa)

12

2025-01-09 (piątek)

  • prezentacje cz. II.1:

    • Igor Kołodziej, Mateusz Iwaniuk

    • Zofia Kamińska, Karolina Dunal

13

2025-01-13

  • prezentacje cz. II.2:

    • Barbara Seweryn, Michał Wietecki

    • Bartłomiej Borycki, Michał Iwaniuk

    • Norbert Frydrysiak, Antoni Kingston

14

2025-01-20

  • prezentacje cz. II.3:

    • Hubert Baraniak, Felicja Warno

    • Natalia Choszczyk, Mateusz Deptuch

    • Krzysztof Adamczyk, Agata Krawczyk

15

2025-01-27

  • prezentacje cz. II.4:

    • Jan Cwalina, Mateusz Jarosz, Bartosz Jezierski

    • Miłosz Chodań, Mikołaj Guzik

    • Adam Kaniasty, Hubert Kowalski

Grupa III: Wtorki 18:15–20:00, 313 MiNI

Tydzień

Data

Temat

1

2025-10-07

  • Wprowadzenie

2

2025-10-14

  • Tematy egzaminacyjne 1:

    • Przykłady algorytmów sortujących i ich właściwości: złożoność, stabilność, dolne ograniczenia złożoności (Krzysztof Tkaczyk)

    • Weryfikacja hipotez: podstawowe pojęcia i własności testów oraz metody konstrukcji testów statystycznych, lemat Neymana-Pearsona (Tomasz Żywicki)

    • Paradygmaty programowania obiektowego. Własności i przykłady języków obiektowych (Urszula Szczęsna)

    • Podział i charakterystyka metod uczenia maszynowego, m.in. nadzorowane vs nienadzorowane (Jan Skwarek)

    • Oprogramowanie FLOSS, oprogramowanie wolne i otwarte (Michał Szewczak)

3

2025-10-21

  • Tematy egzaminacyjne 2:

    • Rodzaje zbieżności ciągów zmiennych losowych (Aleksandra Wójcik)

    • Testowanie oprogramowania: klasyfikacja i dobre praktyki (Michał Zajączkowski)

    • Estymacja przedziałowa: podstawowe pojęcia i metody konstrukcji przedziałów ufności (Dominika Gimzicka)

    • Zadania systemu operacyjnego. Standardy POSIX i SUS. Paradygmaty i założenia projektowe systemów Unix (Aleksandra Samsel)

    • Architektura oparta na zdarzeniach (ang. event-driven architecture) (Bartłomiej Wójcik)

  • Dyskusja: „Ślubuję […] strzec dobrego imienia Politechniki Warszawskiej i […] przyczyniać się do pomnażania dorobku wspólnoty uczelni Politechniki Warszawskiej”, czyli co dały nam studia na MiNI? Co to znaczy być inżynierem?

4

2025-10-28

  • Tematy egzaminacyjne 3:

    • Zwinne metodyki wytwarzania oprogramowania: Wartości, praktyki, procesy i artefakty (Filip Szlingiert)

    • Struktury danych do implementacji kolejek priorytetowych i słowników (Gabriela Majstrak)

    • Idea i przykłady algorytmów ewolucyjnych i innych metaheurystyk optymalizacyjnych (Sebastian Pergała)

    • Układy procesorowe i hierarchia pamięci (Maciej Momot)

    • Wektory losowe: rozkłady łączne i brzegowe, niezależność, korelacja i kowariancja (Kornel Tłaczała)

  • Dyskusja: Social cooling, czyli jak dostęp do danych może zmieniać nasze zachowanie? Kto decyduje o tym, co jest dopuszczalne, a co nie? Polecam też obejrzeć Black Mirror S03E01: Nosedive

5

2025-11-04

  • Tematy egzaminacyjne 4:

    • Skale pomiarowe, ilorazowa, przedziałowa, nominalna. Właściwości i zalecenia związane z prezentacją danych. Najważniejsze typy wykresów (Anna Ostrowska)

    • Reguła SOLID w projektowaniu oprogramowania (Milanna Pahasian)

    • Metody gradientów sprzężonych (Jan Opala)

    • Obciążenie a wariancja modeli uczenia maszynowego, przykłady (Michał Kukla)

    • Rozkłady macierzy na czynniki i ich zastosowania w analizie danych (Katsiaryna Bokhan)

  • Dyskusja: Czego zabrakło nam na studiach? Czego chcielibyśmy się jeszcze nauczyć?

6

2025-11-18

  • Data Science Job Interview Questions - burza mózgów

7

2025-11-25

  • Jak przygotować bibliografię? Gdzie publikują naukowcy? Z jakich baz i źródeł (nie)korzystać (predatory journals itp.)?

  • Podstawowe błędy redakcyjne

  • Wymagania formalne: Opis podziału pracy, deklaracja użycia GenAI (w wielu przypadkach zabronione!)

  • prezentacje cz. I.1:

    • Maciej Momot, Filip Szlingiert

    • Michał Szewczak

8

2025-12-02

  • prezentacje cz. I.2:

    • Martyna Leśniak, Urszula Szczęsna

    • Katsiaryna Bokhan, Milanna Pahasian

    • Krzysztof Tkaczyk, Michał Zajączkowski

9

2025-12-09

  • prezentacje cz. I.3:

    • Kornel Tłaczała, Bartłomiej Wójcik, Tomasz Żywicki

    • Dominika Gimzicka, Aleksandra Samsel, Aleksandra Wójcik

10

2025-12-16

  • prezentacje cz. I.4:

    • Gabriela Majstrak, Jan Opala, Anna Ostrowska

    • Michał Kukla, Jan Skwarek, Sebastian Pergała

11

2025-12-23

  • (konsultacje – obecność nieobowiązkowa)

12

2025-01-09 (piątek)

  • prezentacje cz. II.1:

    • Maciej Momot, Filip Szlingiert

    • Michał Szewczak

13

2025-01-13

  • prezentacje cz. II.2:

    • Martyna Leśniak, Urszula Szczęsna

    • Katsiaryna Bokhan, Milanna Pahasian

    • Krzysztof Tkaczyk, Michał Zajączkowski

14

2025-01-20

  • prezentacje cz. II.3:

    • Kornel Tłaczała, Bartłomiej Wójcik, Tomasz Żywicki

    • Dominika Gimzicka, Aleksandra Samsel, Aleksandra Wójcik

15

2025-01-27

  • prezentacje cz. II.5:

    • Gabriela Majstrak, Jan Opala, Anna Ostrowska

    • Michał Kukla, Jan Skwarek, Sebastian Pergała

Regulamin i zasady zaliczenia

W pierwszej części semestru temat referatu jest określany przez Prowadzącego – obejmuje zakres szeroko rozumianej inżynierii i analizy danych. Prezentacja odbywa się tylko przy użyciu tablicy (jak na egzaminie dyplomowym) – bez własnych notatek, bez slajdów. Odpowiedzi są indywidualne (ok. 5 min. na temat + dyskusja).

W drugiej i trzeciej części semestru każda grupa projektowa (2–3 osobowa) przedstawia referaty (slajdy; ok. 10–15 min.), po których następuje krótka dyskusja (pytania z sali itp.). Referaty dotyczą realizowanych prac dyplomowych. Studenci przedstawiają:

  • ramowy zakres pracy,

  • uzasadnienie wyboru tematu,

  • przegląd literatury związanej z tematyką pracy,

  • osiągnięte oraz planowane rezultaty,

  • przewidywane problemy,

  • podział obowiązków wśród członków zespołu,

  • pomysły na przyszłe badania/rozwijanie tematu,

  • itp.

Studenci za każdym razem pokazują także aktualną wersję PDF pracy (celem oceny stopnia jej zaawansowania).

Każdy z referatów jest oceniany w skali od 0 do 5 punktów. Ocena zależy m.in. od jakości wygłoszonego referatu, poprawności językowej (mówimy pięknie po polsku!), utrzymania wyznaczonych ram czasowych oraz stopnia zaawansowania pracy z uwzględnieniem harmonogramu.

Ostateczną oceną jest zaokrąglona do najbliższej 0,5-ki średnia arytmetyczna z uzyskanych punktów.

Za każdą nieusprawiedliwioną (np. formalnym zaświadczeniem lekarskim) nieobecność obniża się ocenę końcową o 0,25 pkt. Szanujmy siebie nawzajem: skoro kolega lub koleżanka słucha naszej prezentacji, to i my słuchamy ich. Za niewygłoszenie referatu przyznawane jest 0 punktów (zero).

Dodatkowe informacje

Szczegółowe informacje na temat realizacji pracy zostały podane na pierwszych zajęciach.

Redakcja pracy

Język: akademicki, a nie korporacyjny żargon.

Styl: raczej formalny.

Bibliografia

  • Preferujemy cytowanie dobrych książek i czasopism, a nie informacji ze stron internetowych (np. blogów czy Wikipedii, choć mogą być one punktem wyjścia do przeglądu literaturowego).

  • Przeglądu literatury dokonujemy z należytą starannością. ChatGPT lub podobne (np. automatycznie generowane podsumowania w wyszukiwarce G**gle) zwracają niewiarogodne wyniki. Sugerujemy zapoznanie się z bazą Google Scholar lub Scopus.

  • Dostęp do większości czasopism mamy z sieci PW za darmo. Jeśli nie, to preprinty większości artykułów można znaleźć dość łatwo np. na ArXiVie.

  • Unikamy materiałów z kiepskich konferencji oraz tzw. predatory journals, choć i tam znaleźć się mogą perły (tak jak w tzw. renomowanych czasopismach jest wiele śmieci). Zawsze podchodzimy krytycznie do tego, co czytamy.

  • Bibliografię formatujemy przy użyciu BibTeXa lub Bibera, nigdy ręcznie. Formatowanie bibliografii powinno być spójne.

Samodzielność i poprawność pracy

Odpowiadacie za całość treści pracy, w tym jej poprawność merytoryczną.

Prace będą przetwarzane przez system antyplagiatowy.

Nie generujemy/streszczamy/parafrazujemy tekstu pracy, kodu i prezentacji przy użyciu narzędzi informatycznych (GenAI w tym LLM typu ChatGPT, Llama, Copilot itp.). Miejmy swój styl. Chcemy, byście wyrośli na niezależnych ekspertów, których nie zastąpi tzw. AI. Uwaga: wysyłając pracę, składacie oświadczenie że została ona napisana samodzielnie oraz że nie narusza ona praw autorskich.

Świadomy(a) odpowiedzialności karnej za składanie fałszywych zeznań oświadczam, że niniejsza praca dyplomowa została napisana przeze mnie samodzielnie, pod opieką kierującego pracą dyplomową.

Jednocześnie oświadczam, że:

  • niniejsza praca dyplomowa nie narusza praw autorskich w rozumieniu ustawy z dnia 4 lutego 1994 roku o prawie autorskim i prawach pokrewnych (Dz.U. z 2021 r., poz. 1062) oraz dóbr osobistych chronionych prawem cywilnym,

  • niniejsza praca dyplomowa nie zawiera danych i informacji, które uzyskałem(am) w sposób niedozwolony,

  • niniejsza praca dyplomowa nie była wcześniej podstawą żadnej innej urzędowej procedury związanej z nadawaniem dyplomów lub tytułów zawodowych,

  • wszystkie informacje umieszczone w niniejszej pracy, uzyskane ze źródeł pisanych i elektronicznych, zostały udokumentowane w wykazie literatury odpowiednimi odnośnikami,

  • znam regulacje prawne Politechniki Warszawskiej w sprawie zarządzania prawami autorskimi i prawami pokrewnymi, prawami własności przemysłowej oraz zasadami komercjalizacji.

Ponadto składacie osobne oświadczenie dotyczące użycia GenAI.