Dags för kodning
Nu är webbenkäten på Cultura och Folklivsarkivet stängd. Till min stora glädje har totalt 110 svar* kommit in, 35 till Cultura i Finland och 75 till Folklivsarkivet i Sverige. Varmt tack till alla som har bidragit och velat vara med i studien! Nu är det dags att koda alla frågelistsvar som utgör materialet i forskningsprojektet. Här berättar jag lite mer om hur det inledningsvis kan gå till att koda kvalitativt forskningsmaterial.
Med kvalitativt material menas texter av olika slag, till exempel dokument, frågelistor, brev, dagboksanteckningar, tidningsartiklar eller blogginlägg. Det kan också vara transkriberade intervjuer, det vill säga muntliga intervjuer som har nedtecknats och blivit en text. För att koda ett kvalitativ material, inte minst om det är en större mängd material, används vanligtvis numera ett dataprogram. Jag använder mig till exempel av NVivo som är vanligt förekommande. Till kvantitativt material räknas å andra sidan framför allt enkäter av olika slag och ett vanligt analysprogram för det är statistiskdataprogrammet SPSS.
I slutet på förra året gick jag en kurs om NVivo eftersom jag tidigare inte har använt mig av det dataprogrammet. Stegvis har jag börjat importera ett svar i taget till NVivo och kodar respektive svar efter hand som de importerats. Kodning innebär att strukturera och organisera materialet. Koder kan beskrivas som en mängd mindre delar, i detta fallet textdelar, enheter eller ”lådor” med beskrivande etiketter. Vissa forskare föredrar att i stället kalla det indexering. Vidare anser vissa att kodning inte tillhör analysen medan andra, som till exempel jag, menar att kodning är del av analysen för att kodningen innebär en reflektion och tolkning av datans mening, inte minst för att kunna placera det i ”rätt låda”. Vid närläsning av en text uppstår också, i alla fall för mig, frågor, funderingar och reflektioner. Dessa noterar jag i projektjournalen och i minnesanteckningar till den djupgående analysfasen.
Varje kod tilldelas ett kort beskrivande namn och en kodanvisning eller beskrivning som anger vad som menas med koden och som ger vägledning om hur koden ska användas så att den konsekvent används på samma sätt. En kodbeskrivning på vanligtvis en eller två meningar anger med andra ord kriterierna för att koda en specifik textdel eller ett ord under just den koden för att tydligt veta hur och varför det ska sorteras i just den ”lådan”. Genom kodning kan man också förhållandevis enkelt spåra delarna av materialet till sitt ursprung, i detta fallet till respektive berättelse och svar. Allt kan i princip kodas men allt materialet behöver inte nödvändigtvis kodas utan det som är relevant för forskningsprojektet, förutsatt att inte betydelsefull data utelämnas för att styra resultatet i en viss riktning eller för att uppnå ett visst önskat resultat, så kallat bias. Det som kodas i en kod kan vara allt från en hel intervju till ett stycke, en mening eller ett ord. Det kan också vara bilder, del av en bild eller film, beroende på vilket material som samlats in och används i forskningsprojektet. En kod kan också ha underkoder med mer specificerade ”smålådor”. Kodningen eller den så kallade kodboken med alla koder och beskrivningar listade ger en god översikt och kan betraktas som ett register över materialet.
Koder, eller lådor för att organisera materialet, kan delvis göras före materialet erhållits och innanman börjar med själva kodning av materialet. Det kallas deduktiv kodning som då görs utifrån teori, tidigare forskning, frågeställning, frågorna i till exempel en webbent och erfarenhet. Deduktiva koder kan betraktas som en utgångspunkt eller förförståelse som under arbetsprocessen och analysens gång granskas, kritiseras och justeras. Koder kan också göras induktivt, det vill säga skapas efter hand under själva läsningen av det empiriska materialet, i det fall berättelserna. In vivo är ytterligare ett sätt att koda då man som kod använder exakt det ord som informanten använder. Koder är under kodningsprocessen levande och dynamiska, de kan till exempel byta namn, slås samman eller tas bort. Det finns olika metoder men använder man sig av så kallade innehållsanalys och dess principer kan kodningen inte längre modifieras när själva huvudanalysen påbörjats.
För att kunna koda enskilda ord och textavsnitt behöver dokumentet som importeras till NVivo exempelvis vara ett word dokument eller en pdf i formatet OCR (Optical Character Reading), det vill säga vara läsbart som text, och inte scannade som en bild då all text är i ett stycke. Jag fick ett antal svar från arkiven (fysiska brev som skickats in) som pdf:er, med de visade sig inte vara i OCR format. De konverteringsprogram som jag hade fungerade dock inte tillfredställande. De konverterade eller ”översatte” med andra ord inte korrekt, vissa ord blev krumelurer eller felstavade och ibland blev texten inte ens läsbar. Jag blev då tipsad om Free Online OCR PDF to Word. Utan att behöva ladda ned något program kan man mycket enkelt konvertera till exempel pdf till word (upp till 40 sidor utan kostnad om man kostnadsfritt signar upp sig). Jag har tidigare provat ett antal gratis program för konvertering och jag måste säga att Online OCR är det bästa hittills. Ett och annat ord kan ha blivit fel, något ord i fet eller kursiv stil, så är det viktigt att det konverterade dokumentet är helt identiskt med originalet kan man behöva gå igenom det och jämföra med originalet. De få handskrivna brev som kommit in till arkiven har jag fått skriva av och om till maskinskriven text.
Avslutningsvis har jag alltså just fullt upp med att importera och koda materialet. Fortsätter följer!
* I forskningsprojektet kan totalt 102 svar användas för att några svar visade sig vara så kallat nekande svar, det vill säga från Folklivsarkivets befintliga meddelare som svarat att de inte haft några sådana erfarenheter, och några svar var tester.