Raport z ankiety w Excelu: od danych surowych do wniosków na wykresach

0
36
Rate this post

Nawigacja:

Kontekst raportu z ankiety: dla kogo, po co i z jakich danych

Wyniki ankiety kontra raport z ankiety – dwie różne perspektywy

Wyniki ankiety w Excelu to zestaw surowych odpowiedzi: wiersze z respondentami, kolumny z pytaniami, liczby i tekst. Raport z ankiety w Excelu to już przefiltrowana, zinterpretowana i wizualnie uporządkowana historia, która ma odpowiedzieć na konkretne pytania decydentów. Jedno to materiał wejściowy, drugie – produkt końcowy.

Z perspektywy analityka najważniejsze jest, aby dane były kompletne, spójne i poprawnie zmodelowane. Liczą się szczegóły: skale odpowiedzi, brakujące wartości, poprawne typy danych, logiczne ID respondentów. Analityk widzi arkusze „Dane_surowe”, „Słowniki”, „Obliczenia” i myśli o formułach, tabelach przestawnych, filtrowaniu.

Odbiorca raportu ankietowego – dyrektor, klient, szef HR – patrzy inaczej. Chce zrozumieć, co wynika z tych odpowiedzi: gdzie jest problem, co działa dobrze, jakie działania proponujesz. Interesują go wykresy, krótkie komentarze, wskaźniki typu średnia satysfakcja, udział niezadowolonych, trend w czasie. Nie ma czasu ani potrzeby zaglądać w szczegóły struktury danych.

Dobrze zaprojektowany raport z ankiety w Excelu tworzy pomost między tymi dwoma światami. Z jednej strony zachowuje porządną strukturę danych i możliwość drążenia szczegółów, z drugiej – oferuje uproszczony, wizualny widok dla osób nietechnicznych.

Źródła danych ankietowych i ich jakość

Dane do raportu z ankiety w Excelu mogą pochodzić z kilku typowych źródeł. Każde z nich różni się pod względem jakości, struktury oraz tego, ile pracy trzeba włożyć w czyszczenie i przekształcanie danych ankietowych.

Najczęstsze źródła to:

  • Formularze online (np. Microsoft Forms, Google Forms) – zwykle zapewniają jedną tabelę, w której wiersz to jedna odpowiedź, a kolumny odpowiadają pytaniom. Struktura jest relatywnie czysta, ale odpowiedzi wielokrotnego wyboru często trafiają do jednego pola jako tekst rozdzielony przecinkami lub średnikami.
  • Systemy ankietowe (SurveyMonkey, LimeSurvey, dedykowane platformy) – zwykle dają więcej możliwości eksportu: pliki CSV, XLSX, czasem gotowe tabele z zakodowanymi skalami. Struktura bywa lepiej przemyślana, ale też bardziej złożona (oddzielne tabele dla pytań macierzowych, danych demograficznych itd.).
  • Pliki CSV / TXT z własnych systemów – często są „dzikie”: niejednolite nagłówki, mieszane separatory (przecinek vs średnik), błędne kodowanie polskich znaków, niekonsekwentne formaty dat. Wymagają solidnego przygotowania przed rzetelną analizą wyników ankiety w Excelu.
  • Ręczne wpisy (np. ankiety papierowe przepisane do Excela) – najwyższe ryzyko błędu ludzkiego, niespójności i literówek. W zamian masz większą kontrolę nad tym, jak od razu strukturyzujesz odpowiedzi (np. stosując listy rozwijane i walidację danych).

Im bardziej ustandaryzowane narzędzie ankietowe, tym mniej technicznego bałaganu, ale tym częściej trzeba dobrze rozumieć, jak system zakodował skale, odpowiedzi wielokrotne, brak odpowiedzi czy pytania warunkowe. Z kolei dane przepisywane ręcznie wymagają więcej czyszczenia treści, ale możesz od początku planować strukturę raportu z ankiety krok po kroku.

Trzy główne cele raportu z ankiety w Excelu

Ten sam plik z wynikami ankiety może służyć różnym odbiorcom i różnym celom. Inaczej zaprojektujesz dashboard ankietowy w Excelu na krótką prezentację dla zarządu, inaczej – raport z pełną dokumentacją badania. W praktyce da się wyróżnić trzy główne zastosowania raportów ankietowych.

1. Szybki przegląd sytuacji – potrzebny, gdy trzeba w kilka minut pokazać ogólne wyniki. Tu liczy się:

  • kilka kluczowych wskaźników (np. średnia satysfakcja, NPS, odsetek odpowiedzi „zdecydowanie tak”),
  • proste wykresy kolumnowe lub kołowe z rozkładem najważniejszych pytań,
  • minimum filtrowania – raport raczej statyczny, gotowy do wklejenia do prezentacji.

2. Wsparcie decyzji zarządczych – raport ankietowy jako narzędzie do planowania działań. Tutaj rośnie rola interaktywności:

  • tabele przestawne z przekrojami (np. satysfakcja według działu, regionu, segmentu klienta),
  • interaktywne filtry (slicery), które pozwalają przeglądać wyniki różnych grup,
  • wykresy pokazujące trendy w czasie (jeśli ankieta była powtarzana lub miała daty odpowiedzi).

3. Dokumentacja badań – szczegółowy raport z ankiety w Excelu, który ma być archiwum i materiałem referencyjnym. W takim przypadku ważne są:

  • pełna lista pytań i odpowiedzi,
  • opis metodologii (kto odpowiadał, w jakim okresie, jak prowadzono badanie),
  • tabele i wykresy dla większości kluczowych pytań, z możliwością późniejszego pogłębienia analizy.

Inaczej więc ustawisz priorytety: raz nacisk jest na estetyczny layout raportu ankietowego, innym razem na kompletność danych i możliwość dociekania szczegółów. Zdefiniowanie celu od początku ułatwia dobór typu wykresów, poziomu szczegółowości i układu arkuszy.

Pytanie przewodnie raportu: co tak naprawdę chcesz pokazać

Raport z ankiety w Excelu bez jasno określonego pytania przewodniego szybko zamienia się w galerię wykresów bez wyraźnej logiki. Dane ankietowe są kuszące: można sprawdzać wszystko ze wszystkim. Kluczowa decyzja to określenie, o czym ma „opowiadać” raport.

Najczęstsze pytania przewodnie to:

  • Ogólna satysfakcja – np. „Jak kształtuje się satysfakcja klientów z obsługi telefonicznej?”; w centrum znajdą się skale ocen, NPS, rozkład odpowiedzi w poszczególnych segmentach.
  • Diagnoza problemu – np. „Dlaczego pracownicy rozważają odejście z firmy?”; większy nacisk na zależności między kilkoma pytaniami (satysfakcja z wynagrodzenia, styl zarządzania, rozwój).
  • Ocena zmiany lub projektu – np. „Jak klienci oceniają nowy proces reklamacji?”; ważne są porównania „przed / po”, analiza w czasie, różnice między grupami.

Bez takiego pytania łatwo wpaść w pułapkę zbyt szczegółowej prezentacji każdego pytania osobno. W efekcie odbiorca ginie w szczegółach, zamiast widzieć kluczowe wnioski. Pytanie przewodnie naturalnie porządkuje raport: od głównych wskaźników, przez kluczowe przekroje, po uzupełniające szczegóły.

Różne potrzeby odbiorców raportu

Raport z ankiety w Excelu rzadko jest czytany tylko przez jedną osobę. Ten sam plik może trafić do zarządu, HR, marketingu i operacji. Każda z tych grup oczekuje czegoś innego.

  • Zarząd – interesuje go kilka wskaźników i jasne wnioski. Potrzebuje:
    • 1–2 arkuszy z najważniejszymi liczbami i wykresami,
    • sygnalizacji problemów (np. kolory: czerwony – obszar ryzyka, zielony – dobre wyniki),
    • krótkich komentarzy tekstowych przy kluczowych wykresach.
  • HR lub dział operacyjny – chcą wejść w szczegóły:
    • raport według działów, lokalizacji, stanowisk,
    • możliwość filtrowania wyników dla swojej jednostki,
    • dostęp do danych szczegółowych (np. odpowiedzi z pytań otwartych).
  • Marketing, obsługa klienta – analizują wyniki w kontekście innych danych (sprzedaż, churn, reklamacje). Będą zwracać uwagę na:
    • segmenty klientów (typ, branża, wielkość),
    • kanały kontaktu, źródło pozyskania klienta,
    • wskaźniki oceny konkretnych elementów oferty lub procesu.

Dobrym podejściem jest podział raportu na kilka zakładek (lub sekcji dashboardu): „Zarząd”, „HR”, „Marketing” – wszystkie korzystają z tych samych danych i obliczeń, ale mają inny poziom szczegółowości i inne standardy prezentacji.

Przygotowanie danych surowych z ankiety do pracy w Excelu

Jak wygląda „idealna” tabela z wynikami ankiety

Zanim zacznie się analiza wyników ankiety w Excelu, warto uporządkować strukturę danych. Idealna tabela do dalszej pracy ma kilka cech, które bardzo ułatwiają tworzenie raportu z ankiety krok po kroku:

  • Jedna odpowiedź (respondent) = jeden wiersz – każdy wiersz to kompletny rekord odpowiedzi danej osoby lub sesji (w zależności od setupu ankiety). Dzięki temu łatwo liczyć liczebności, przeliczać wskaźniki i korzystać z tabel przestawnych.
  • Jedno pytanie = jedna kolumna – każda kolumna reprezentuje albo pytanie z ankiety (np. P1, P2…), albo zmienną opisową (np. płeć, dział, region, typ klienta).
  • Osobna kolumna z identyfikatorem odpowiedzi – np. ID_respondenta, ID_odpowiedzi. Nawet jeśli system ankietowy go nie generuje, warto stworzyć własny, np. za pomocą wypełnionej serii 1, 2, 3…
  • Osobna kolumna z datą / czasem odpowiedzi – nie musi być precyzyjny do sekundy, ale data pozwala na raportowanie w czasie, odfiltrowanie testów, odróżnienie fal badania.

Prosty przykład struktury dla ankiety pracowniczej:

ID_odpowiedziDataDziałStanowiskoP1_Satysfakcja_pracaP2_SzefP3_RozwójP4_Komentarz_otwarty
12025-02-01SprzedażSpecjalista453Brakuje szkoleń z produktu.
22025-02-01ITAnalityk544Jest OK.

Taka postać danych ankietowych sprawia, że nie trzeba przekształcać formatu przy każdej próbie analizy, a raporty i dashboardy ankietowe w Excelu można budować w oparciu o powtarzalne schematy.

Dane „od razu gotowe” a dzikie CSV – co trzeba sprawdzić

Sposób przygotowania danych zależy od tego, jak wygląda plik wyjściowy. Dwa skrajne przypadki to:

  • Eksport z systemu ankietowego, który deklaruje, że plik jest „gotowy do Excela”.
  • Dzikie CSV z nieopisanymi kolumnami, problemami z polskimi znakami, bez jasnej struktury.

W pierwszym przypadku plik bywa czystszy, ale wciąż warto przejść krótką checklistę:

  • czy nagłówki kolumn są jednoznaczne (np. P1, P2 vs „Jak oceniasz…?”),
  • czy skale są zakodowane liczbami (np. 1–5) i czy jest do nich legenda,
  • jak wyglądają odpowiedzi wielokrotnego wyboru (osobne kolumny czy tekst w jednej komórce),
  • czy system nie dodał wierszy podsumowujących na końcu (np. „Total responses: …”).

Przy „dzikim” CSV lista kontroli jest dłuższa. Na początku trzeba zwrócić uwagę na:

  • separator pól – przecinek, średnik czy tabulator; w Excelu przy imporcie z tekstu trzeba wybrać prawidłowy, aby kolumny się nie zlały,
  • kodowanie znaków – jeśli polskie litery są popsute, przy imporcie należy wybrać odpowiednie kodowanie (najlepiej UTF-8),
  • nagłówki kolumn – bywa, że brakuje pierwszego wiersza z opisami lub zawiera on dziwne znaki; często wygodniej jest nadpisać je własnymi, krótkimi nazwami,
  • puste kolumny i wiersze – częste pośrednie artefakty eksportu, które trzeba usunąć przed rozpoczęciem analizy.

Rzetelne przygotowanie pliku na tym etapie oszczędza mnóstwo nerwów przy próbach tworzenia tabel przestawnych i wykresów do prezentacji odpowiedzi.

Identyfikatory odpowiedzi i rola daty w analizie

W prostych ankietach pokusa jest taka: „Przecież każdy wiersz i tak jest unikalny, po co dodatkowe ID?”. W praktyce warto mieć osobną kolumnę z jednoznacznym identyfikatorem odpowiedzi, bo:

  • ułatwia to późniejsze łączenie danych (np. z innym badaniem, z systemem CRM),
  • pozwala odwoływać się do konkretnego rekordu w formułach pomocniczych,
  • pomaga przy deduplikacji (jeśli pojawią się powtarzające się odpowiedzi).

Znaczniki fal badania, wersji ankiety i filtrów technicznych

Przy jednorazowej ankiecie w małej firmie kolumna z datą bywa wystarczająca. Sytuacja zmienia się przy cyklicznych badaniach, testach A/B ankiety albo gdy ten sam kwestionariusz ma kilka wersji językowych. Wtedy sama data to za mało – potrzebne są dodatkowe „metazmienne”, które precyzyjniej opisują odpowiedzi.

Najczęściej dodaje się kilka prostych kolumn:

  • Fala_badania – np. „2024_Q1”, „2024_Q2” albo „Pilotaż”, „Główne”; ułatwia to porównania w czasie i filtrowanie tylko aktualnych wyników.
  • Wersja_ankiety – gdy część respondentów widziała inną kolejność pytań lub inne warianty odpowiedzi; bez tego porównywanie rozkładów w jednym arkuszu może prowadzić do mylnych wniosków.
  • Język – przy wielojęzycznych ankietach dzięki temu da się porównywać całe grupy, a jednocześnie odfiltrować np. zbyt małe podpróby.
  • Flagi_techniczne – np. „TEST” (czy odpowiedź pochodzi z testowania ankiety), „Niekompletna” (czy respondent przerwał przed końcem), „Wyklucz_z_analizy” (np. wypełnienia spoza grupy docelowej).

W praktyce lepiej mieć kilka dodatkowych prostych kolumn niż później kombinować z odgadywaniem, dlaczego liczebności się nie zgadzają. Tego rodzaju meta‑informacje są szczególnie ważne, gdy raport z ankiety w Excelu ma służyć kilka lat, a osoby analizujące dane będą się zmieniać.

Łączenie danych ankietowych z innymi źródłami

Sam Excelowy plik z odpowiedziami ankietowymi często jest tylko jednym z elementów większej układanki. Zestawienie ankiety klientowskiej z danymi sprzedażowymi czy wyników badania zaangażowania z rotacją pracowników pozwala przejść od opisowych wykresów do dużo ciekawszych zależności.

Typowe scenariusze łączenia danych to:

  • ankieta klientów + CRM / faktury – np. dopasowanie ID_klienta z ankiety do bazy sprzedażowej, aby sprawdzić, czy niższa satysfakcja koreluje z niższą wartością zakupów,
  • ankieta pracownicza + HR – połączenie działu, stażu i stanowiska z ankietą, jeśli nie były zbierane bezpośrednio w kwestionariuszu,
  • ankieta produktowa + logi systemowe – zestawienie ocen z faktycznym wykorzystaniem funkcji produktu.

Technicznie w Excelu są dwa podstawowe sposoby:

  1. Łączenie klasycznymi formułami – np. XLOOKUP / WYSZUKAJ.X, INDEX + MATCH; dobre przy prostych, jednorazowych połączeniach i małych tabelach.
  2. Model danych / Power Query – wygodniejszy przy większej liczbie źródeł lub regularnie aktualizowanych raportach. Tabele łączy się po kluczach (np. ID_klienta, PESEL_anonimizowany, kod jednostki), a wyniki odświeża jednym kliknięciem.

Różnica jest podobna jak między ręcznym przepisaniem kilku numerów a stworzeniem kontaktu w telefonie. Przy jednym raporcie jednorazowo da się obejść bez łączenia w Power Query, ale przy cyklicznym raporcie z ankiety przy użyciu kilku źródeł formuły szybko stają się trudne do utrzymania.

Czyszczenie i standaryzacja danych ankietowych

Typowe problemy z jakością danych z ankiety

Nawet najlepiej zaprojektowany kwestionariusz nie gwarantuje perfekcyjnych danych. Już pierwszy rzut oka na arkusz z odpowiedziami często ujawnia kilka powtarzających się kłopotów:

  • różne zapisy tej samej kategorii – „Sprzedaż”, „Sprzedaz”, „Dział sprzedaży”…
  • mieszanie typów danych – skala 1–5 raz jako liczby, raz jako tekst („5”, „bardzo zadowolony”),
  • puste odpowiedzi i przerwane ankiety,
  • odpowiedzi testowe (np. ciągi znaków „test”, „xxx”),
  • literówki w odpowiedziach otwartych, które utrudniają grupowanie.

Czyszczenie danych to etap, którego nie widać na ładnych wykresach, ale to właśnie on decyduje o wiarygodności wniosków. Nawet prosta zmiana – np. ujednolicenie nazw działów – potrafi istotnie zmienić wyniki w tabeli przestawnej.

Ujednolicanie kategorii i słowników

Najwięcej pracy zwykle przynosi porządkowanie pól opisowych (dział, region, typ klienta). System ankietowy często nie wymusza wyboru z listy, tylko pozostawia pole tekstowe, a respondenci i administratorzy wprowadzają różne warianty tego samego pojęcia.

Najbardziej uporządkowane podejście to stworzenie osobnego arkusza ze słownikami i powiązanie go z danymi za pomocą formuł lub Power Query. Przykładowo:

  • w arkuszu Słowniki powstaje tabela dzial_surowydzial_standard,
  • w arkuszu z danymi dodaje się nową kolumnę Dział_standard, która za pomocą WYSZUKAJ.X zamienia „Sprzedaz”, „sales”, „Dział sprzedaży” na „Sprzedaż”.

Takie słowniki mają kilka zalet w porównaniu z ręcznym zamienianiem wartości:

  • wszystkie zasady są w jednym miejscu,
  • łatwo dodać nową regułę (pojawia się nowy wariant – dopisuje się go do tabeli),
  • nawet po aktualizacji danych (nowy eksport) standaryzacja działa automatycznie.

Przy większej liczbie pól opisowych lepiej rozbić słowniki na osobne tabele (działy, regiony, typy klientów) niż trzymać jedną „mega‑tabelę” z wieloma kolumnami. Łatwiej wtedy utrzymać porządek i unika się przypadkowych błędów.

Braki danych: ignorować, imputować czy oznaczać?

Puste pola (braki odpowiedzi) pojawiają się z różnych powodów: respondent pominął pytanie, przerwał ankietę, pytanie nie dotyczyło danej osoby (logika warunkowa). To nie jest jeden problem, tylko kilka różnych sytuacji, które wymagają innego traktowania.

W praktyce stosuje się trzy główne podejścia:

  1. Ignorowanie w obliczeniach – brak jest po prostu pomijany (AVERAGE i tabele przestawne domyślnie tak działają). Dobre przy prostych skalach, gdy odsetek braków jest niewielki.
  2. Wyraźne oznaczanie braków – np. kod „99 = nie dotyczy”, „98 = brak odpowiedzi”, osobne kategorie w tabelach przestawnych. To lepsza opcja, gdy sama informacja o tym, kto nie odpowiedział, jest istotna (np. w badaniach satysfakcji pracowników w poszczególnych działach).
  3. Imputacja (zastępowanie) braków – np. średnią z grupy, medianą, ostatnią znaną wartością. W raportach ankietowych w Excelu rzadko stosowane, chyba że analiza ma charakter bardziej statystyczny niż raportowy.

Wybór podejścia zależy od tego, jak duża część danych jest pusta i czego dotyczy pytanie. Jeśli puste pola dotyczą jednego nieobowiązkowego pytania otwartego – zwykle wystarczy je pominąć. Jeżeli jednak 30% osób w całym dziale nie odpowiada na kluczowe pytanie o satysfakcję wynagrodzenia, umieszczenie osobnej kategorii „Brak odpowiedzi” mówi o tym dziale coś ważnego.

Filtrowanie odpowiedzi niskiej jakości

Oprócz klasycznych braków pojawiają się odpowiedzi, które „technicznie” istnieją, ale analitycznie są wątpliwe. Przykłady:

  • ankiety wypełnione w kilka sekund przy bardzo długim kwestionariuszu,
  • ciągi znaków „asdf”, „xxx” w polach otwartych,
  • zawsze ta sama skrajna odpowiedź w każdej skali (tzw. straightlining),
  • duplikaty odpowiedzi z tym samym identyfikatorem użytkownika.

Możliwe są dwa podejścia do takich rekordów:

  • twarde wykluczenie – ustawienie flagi „Wyklucz_z_analizy = TAK” i pomijanie tych odpowiedzi w tabelach przestawnych (np. przez zastosowanie filtru),
  • miękkie oznaczenie – flaga „Potencjalnie_niska_jakość”, z możliwością włączania i wyłączania ich w zależności od rodzaju analiz.

Lepsze jest flagowanie niż bezpowrotne usuwanie wierszy. Jeśli za rok ktoś będzie chciał zweryfikować decyzję o wykluczeniu części odpowiedzi, łatwo włączy je z powrotem do raportu z ankiety i porówna wyniki.

Standaryzacja skal ocen i zamiana na wskaźniki

W jednym badaniu pojawiają się często różne skale: 1–5, 1–10, 0–10, werbalne („zdecydowanie się nie zgadzam – zdecydowanie się zgadzam”). Porównywanie pytań między sobą wymaga ich ujednolicenia, przynajmniej na poziomie raportowym.

Najczęściej stosowane podejścia:

  • Pozostawienie oryginalnych skal – dobre, gdy każde pytanie jest analizowane osobno, bez prób tworzenia „średniego wskaźnika” ze wszystkiego.
  • Przeliczenie na jeden wspólny indeks – np. skalowanie 1–5 i 1–10 do zakresu 0–100 (prosta formuła: (wartość - min)/(max - min)*100). Ułatwia to prezentację kilku pytań na jednym wykresie.
  • Dychotomizacja – sprowadzanie odpowiedzi do „zadowolony / niezadowolony”, „poleci / nie poleci” (np. NPS). Dobre przy komunikacji z zarządem, ale kosztem utraty szczegółowości.

Przykład: pytanie o satysfakcję w skali 1–5 i pytanie o łatwość obsługi w skali 1–10. Jeśli oba mają być częścią jednego wskaźnika „Ogólne doświadczenie”, sensowniej przeliczyć je na 0–100, niż liczyć „średnią z 1–5 i 1–10”, co jest matematycznie nielogiczne.

Luksusowe wnętrze Mercedesa SLC z nowoczesnym panelem sterowania
Źródło: Pexels | Autor: Mike Bird

Strukturyzowanie pytań ankietowych: skale, kategorie, odpowiedzi wielokrotne

Rodzaje pytań a sposób zapisu w Excelu

Różne typy pytań wymagają innego traktowania w tabeli danych. Inaczej zapisuje się prostą skalę 1–5, inaczej pytania jednokrotnego wyboru, a jeszcze inaczej wielokrotnego wyboru lub rankingi.

Najprostszy podział to:

  • pytania ilościowe / skale – odpowiedzi liczbowe, np. 1–5, liczba lat, wiek, częstotliwość,
  • pytania kategoryczne jednokrotnego wyboru – jedna kategoria na respondenta (płeć, dział, region),
  • pytania kategoryczne wielokrotnego wyboru – respondent może wybrać kilka opcji (kanały kontaktu, powody wyboru usługi),
  • pytania otwarte – tekst dowolnej długości.

Kluczowe jest nie tylko to, jak wynik wygląda w Excelu, ale też jak ma być później analizowany. Ten sam typ pytania można zapisać w różny sposób, a wybór formatu ma konsekwencje dla pracy z tabelami przestawnymi i wykresami.

Skale Likerta i inne skale ocen

Skale typu „zdecydowanie się nie zgadzam – zdecydowanie się zgadzam” są podstawą większości raportów ankietowych. Pod względem Excela są wygodne, o ile zostaną konsekwentnie zakodowane.

Są dwa główne podejścia do kodowania:

  1. Kodowanie liczbowo – np. 1–5, 1–7, 0–10. Umożliwia:
    • obliczanie średnich i odchyleń,
    • tworzenie wykresów z jedną wartością (średnia) na pytanie,
    • łatwe przeliczanie na indeksy 0–100.
  2. Kodowanie werbalne – pełne nazwy: „Zdecydowanie się zgadzam”, „Raczej się zgadzam” itd. Daje:
    • czytelne etykiety w tabelach przestawnych,
    • brak potrzeby korzystania z legendy kodów,
    • ale utrudnia liczenie średnich (konieczna mapująca tabela pomocnicza).

Najbardziej elastyczny bywa hybrydowy model: w arkuszu z danymi trzyma się wartości liczbowe, a w osobnym arkuszu – słownik mapujący np. „1 = zdecydowanie się nie zgadzam, 5 = zdecydowanie się zgadzam”. W raportach na wykresach używa się opisów słownych, a w formułach – liczb.

Pytania jednokrotnego wyboru a raportowanie przekrojowe

Pytania z jedną odpowiedzią (płeć, dział, kraj, wiek w przedziałach) są najprostsze do raportowania. W Excelu każdemu z nich odpowiada jedna kolumna, a każda odpowiedź to jedna wartość kategorii.

Najczęstsze problemy pojawiają się wtedy, gdy:

  • kolumna miesza wartości opisowe i liczby (np. „18–24”, „25–34”, 35),
  • ten sam przedział wiekowy zapisano na kilka sposobów („18-24”, „18 – 24”, „18 do 24”),
  • granice przedziałów zmieniły się między falami badania.

Pytania wielokrotnego wyboru: jedna kolumna czy wiele?

Najwięcej dylematów budzi zapis pytań, w których respondent może zaznaczyć kilka odpowiedzi (np. „Z jakich kanałów kontaktu korzystasz?”). Dostawcy ankiet eksportują je przynajmniej na dwa sposoby, a każdy ma inne konsekwencje przy pracy w Excelu.

Najpopularniejsze warianty:

  1. Jedna kolumna z listą odpowiedzi – np. E‑mail; Telefon; Chat. Zalety:
    • mniej kolumn w arkuszu,
    • łatwe filtrowanie po zawartości tekstu.

    Wady:

    • tabele przestawne traktują całą listę jako jedną kategorię,
    • liczenie udziałów kanałów wymaga dodatkowego rozbicia tekstu (Power Query, formuły tekstowe).
  2. Osobna kolumna dla każdej opcji – np. Kanał_email, Kanał_telefon, Kanał_chat z wartościami 0/1 lub TAK/NIE. Zalety:
    • łatwe liczenie odsetków zaznaczeń dla każdej opcji,
    • przejrzysta analiza w tabelach przestawnych po jednej kolumnie naraz.

    Wady:

    • wzrost liczby kolumn przy rozbudowanych pytaniach,
    • konieczność aktualizacji struktury przy dodaniu nowej opcji.
  3. Format „long” (wiele wierszy na respondenta) – rzadziej spotykany w surowym eksporcie, częściej budowany samodzielnie (np. w Power Query). Każdy wiersz opisuje jedną zaznaczoną odpowiedź: ID_respondenta – Pytanie – Odpowiedź. Zalety:
    • idealne do tabel przestawnych (od razu wiadomo, ile razy dana odpowiedź wystąpiła),
    • łatwa agregacja odpowiedzi z wielu fal / badań.

    Wady:

    • bardziej abstrakcyjny układ dla osób przyzwyczajonych do „jednego wiersza na ankietę”,
    • do pracy z cechami respondenta potrzebne są połączenia (np. relacje modeli danych).

Przy prostych, jednorazowych badaniach najczęściej wygrywa model „wiele kolumn 0/1”, bo jest najbardziej transparentny. Przy cyklicznych raportach i rozbudowanych ankietach długoterminowo wygodniejszy bywa format „long”, zwłaszcza gdy raport powstaje na modelu danych (Power Pivot).

Rankingi i pytania o pierwszeństwo wyboru

Rankingi („Uszereguj w kolejności ważności…”) są analitycznie ciekawsze niż proste pytania jednokrotnego wyboru, ale trudniej je zapisać. Zwykle stosuje się dwa modele:

  • Kolumny „pozycje” – np. 1_miejsce, 2_miejsce, 3_miejsce, gdzie w komórkach znajdują się nazwy opcji („Cena”, „Jakość”, „Obsługa”). Sprzyja analizie typu:
    • „co najczęściej było na 1. miejscu?”,
    • „co najczęściej lądowało w TOP3?”.
  • Kolumny „opcje” z rangą – np. Ranga_cena, Ranga_jakość, Ranga_obsługa z wartościami liczbowymi (1 – najwyżej, 5 – najniżej). Ułatwia:
    • liczenie średniej rangi dla każdej opcji,
    • porównanie „hierarchii ważności” między działami czy regionami.

W raportach zarządczych częściej przydaje się drugi wariant. Średnia ranga dobrze nadaje się na wykresy słupkowe (im niższa, tym ważniejsza opcja), a dodatkowo łatwo wydzielić „TOP3 o najniższej średniej randze” za pomocą prostych formuł i sortowania.

Pytania otwarte: kiedy i jak je kodować?

Odpowiedzi tekstowe są bogate w treść, ale mało przyjazne dla Excela. Przy małej liczbie ankiet da się je czytać ręcznie, jednak w raportach cyklicznych zwykle kończy się na przynajmniej częściowym kodowaniu.

Można obrać dwa skrajne kierunki:

  1. Brak kodowania, tylko filtrowanie i wyszukiwanie – dobre przy:
    • niewielkiej liczbie odpowiedzi otwartych,
    • potrzebie cytowania konkretnych wypowiedzi w raporcie.

    W Excelu sprowadza się to do filtrowania po słowach kluczowych, ewentualnie zastosowania funkcji wyszukiwania tekstu.

  2. Kodowanie tematyczne – tworzenie 1–3 dodatkowych kolumn z kodami: np. Temat_1, Temat_2, Sentiment. Przykładowo:
    • „długi czas oczekiwania na infolinii” – kody: „Obsługa klienta”, „Czas reakcji”, „Negatywny”,
    • „bardzo pomocna pani z działu technicznego” – kody: „Obsługa klienta”, „Kompetencje”, „Pozytywny”.

Kodowanie przypomina tworzenie słowników, ale bardziej subiektywnych. Dla spójności dobrze, gdy jedna osoba lub zespół definiuje zamknięty katalog kategorii (np. 10–20 haseł) i korzysta z list rozwijanych w Excelu. W przeciwnym razie „Brak informacji” i „Brak komunikacji” staną się dwiema odrębnymi kategoriami, mimo że analitycznie opisują podobny problem.

Łączenie wielu pytań w jeden wskaźnik

Z kilku podobnych pytań (np. o różne aspekty obsługi) często buduje się jeden wskaźnik zbiorczy. W Excelu można to zrobić dość prosto, ale wybór metody ma wpływ na późniejszą interpretację.

Najczęściej stosowane konstrukcje:

  • Średnia z kilku pytań – np. =(P1 + P2 + P3)/3. Plusy:
    • prosta, intuicyjna konstrukcja,
    • dobrze działa przy spójnych skalach (np. wszędzie 1–5).

    Minusy:

    • każde pytanie ma takie samo znaczenie, niezależnie od wagi biznesowej,
    • braki danych w jednym pytaniu wymagają specjalnego traktowania (np. AVERAGE zamiast prostego dzielenia).
  • Średnia ważona – np. satysfakcja z obsługi ważona znaczeniem kanału. Przykładowa formuła:
    =SUMA(P1*0,5; P2*0,3; P3*0,2)

    Daje większą kontrolę nad tym, co „ciągnie” wskaźnik w górę lub w dół, ale wymaga wcześniejszej dyskusji, jakie wagi są uzasadnione.

  • Udziały odpowiedzi pozytywnych – np. odsetek odpowiedzi 4–5 na skali 1–5. W praktyce:
    • tworzy się osobną kolumnę z flagą „pozytywna/niepozytywna” dla każdego pytania,
    • następnie liczy się udział pozytywnych odpowiedzi w grupie.
    • Dobrze sprawdza się przy raportowaniu dla menedżerów liniowych, którym łatwiej odczytać „72% pozytywnych ocen” niż „średnia 4,1”.

Warto porównać wyniki różnych wariantów na małej próbie (np. jednym dziale). Jeśli ranking działów zmienia się diametralnie w zależności od metody liczenia wskaźnika, konstrukcja wymaga ponownego przemyślenia.

Mapowanie pytań między falami i wersjami ankiety

W dłuższej perspektywie niemal każda ankieta jest modyfikowana: zmienia się brzmienie pytań, skale, czasem odpadają całe bloki. Aby raport roczny czy trend wieloletni miał sens, konieczne jest powiązanie pytań z różnych wersji.

Praktyczny sposób to stworzenie tabeli mapującej pytania w osobnym arkuszu, z kolumnami typu:

  • ID_pytania_surowe – identyfikator z eksportu (np. Q1_2022, Q1_2023),
  • Tekst_pytania – pełna treść w oryginalnej wersji,
  • ID_pytania_standard – wspólny kod logiczny (np. SAT_OBSLOG),
  • Wersja_skali – np. „1–5”, „0–10”, „5 opcji werbalnych”,
  • Uwagi_dotrzendów – krótka notatka, czy pytanie można bezpośrednio porównać, czy wymaga przeliczeń.

Taka mapa pozwala oddzielić dwa światy:

  • „jak nazywa się i wygląda pytanie w danej fali”,
  • „do którego logicznego wskaźnika powinno trafić w raporcie”.

Jeśli pytanie zmieniło się tylko kosmetycznie (np. doprecyzowano przykład), często można przyjąć pełną porównywalność. Jeżeli jednak zmieniono skalę z 1–5 na 0–10 lub przebudowano odpowiedzi (dodano opcję „Nie korzystam”), wyniki trzeba przeliczyć lub przynajmniej wyraźnie oznaczyć, że porównanie ma charakter orientacyjny.

Projektowanie szkieletu raportu ankietowego w Excelu

Oddzielenie danych, logiki i prezentacji

Najbardziej czytelne raporty ankietowe w Excelu mają trójwarstwową strukturę:

  1. Warstwa danych – arkusze z surowymi lub oczyszczonymi odpowiedziami, słownikami, mapami pytań. Tu nie ma żadnych kolorowych wykresów ani fragmentatorów.
  2. Warstwa logiki – arkusze z:
    • formułami agregującymi (średnie, odsetki, wskaźniki),
    • tabelami przestawnymi,
    • pomocniczymi tabelami do wykresów (np. TOP5 według działów).
  3. Warstwa prezentacji – 1–2 arkusze pełniące rolę „dashboardu”: wykresy, kafelki, segmentatory.

Taki podział ma dwie przewagi nad „wszystko w jednym arkuszu”. Po pierwsze, łatwiej diagnozować błędy (wiadomo, czy źródłem problemu jest data, formuła czy wykres). Po drugie, aktualizacja danych (np. nowy eksport z ankiety) wymaga minimalnego dotykania warstwy prezentacyjnej – wykresy i tabele oparte na tabelach dynamicznych z reguły odświeżą się same.

Organizacja arkuszy i nazewnictwo

Układ skoroszytu ma duże znaczenie przy pracy zespołowej. Dwa skrajne podejścia to:

  • Jeden obszerny plik „all‑in‑one” – wszystko w jednym skoroszycie: dane, słowniki, przeliczenia, dashboard. Plusy:
    • łatwe przekazanie raportu „w jednym pliku”,
    • brak problemów z relatywnymi ścieżkami i odwołaniami między plikami.

    Minusy:

    • rosnący rozmiar pliku,
    • większe ryzyko przypadkowego nadpisania danych.
  • Rozdzielenie na plik danych i plik raportu – dane z ankiety w jednym skoroszycie (lub kilku), raport w drugim, połączone połączeniami (Power Query, łącza zewnętrzne). Plusy:
    • łatwiejsza wymiana samych danych (np. nowy eksport z systemu),
    • możliwość równoległej pracy nad raportem bez dotykania pliku źródłowego.

    Minusy:

    • konieczność nadzoru nad łączami (ścieżki sieciowe, OneDrive, SharePoint),
    • trudniejsze udostępnianie osobom, które mają ograniczone uprawnienia do lokalizacji danych.

W licznych zespołach często sprawdza się kompromis: techniczny skoroszyt „dane + logika”, do którego dostęp mają analitycy, oraz osobny, „lekki” plik z samymi widokami (dashboardami), aktualizowanymi przez odświeżenie połączeń.

Szkielet raportu: przegląd ogólny vs. raporty szczegółowe

Raport z ankiety rzadko ma tylko jednego odbiorcę. Zarząd, HR, menedżerowie działów – każdy potrzebuje czegoś innego. Szkielet raportu warto więc ułożyć wokół dwóch głównych widoków:

  • Przegląd ogólny – kilka kluczowych wskaźników i wykresów, takich jak:
    • średnie wyniki głównych obszarów (np. satysfakcja ogólna, obsługa, produkt),
    • zmiana vs. poprzednia fala,
    • podstawowy podział na największe segmenty (np. regiony, typ klientów).

    Ten arkusz jest najczęściej pierwszym otwieranym miejscem – powinien działać bez filtru „specjalistycznej wiedzy”.

  • Raporty szczegółowe – zwykle po jednym arkuszu na:
    • domenę (np. „Obsługa klienta”, „Produkt”, „Komunikacja”),
    • typ przekroju (np. „Działy”, „Regiony”, „Poziomy stanowisk”).

    Tu pojawiają się tabele przestawne z rozwijanymi listami pytań, dodatkowe wskaźniki, wykresy pokazujące rozkłady odpowiedzi zamiast samych średnich.

Jeżeli raport ma wiele zakładek, przydaje się prosty „spis treści” – osobny arkusz z linkami do kluczowych widoków (hiperłącza do arkuszy, opis tekstowy, do kogo dany widok jest adresowany).

Planowanie filtrów i segmentatorów

Większość użytkowników raportu ankietowego chce „poklikać” – zawęzić wyniki do swojego działu, kraju czy typu klienta. W Excelu obsługują to segmentatory i filtry raportu w tabelach przestawnych.

Źródła

  • Survey Methodology. Wiley (2004) – Podstawy projektowania badań ankietowych i interpretacji wyników
  • Designing and Conducting Survey Research: A Comprehensive Guide. Jossey-Bass (2014) – Planowanie badań, struktura pytań, skale odpowiedzi, raportowanie
  • Standards for Educational and Psychological Testing. American Educational Research Association (2014) – Standardy jakości danych, rzetelność i trafność pomiaru ankietowego
  • Guidelines for Best Practice in Cross-Cultural Surveys. Survey Research Center, University of Michigan (2016) – Jakość danych, brakujące wartości, spójność i kodowanie odpowiedzi