benvenuti su Paideia

Glossario

Il testo del glossario è stato discusso e approntato in sei apposite riunioni del comitato editoriale della collana:
Milano, 14 luglio '92,
Milano, 31 maggio '93,
Milano, 17 novembre '95,
Firenze, 9 giugno '96,
Milano, 13 giugno '97,
Chiusi, 16-18 luglio '98.

E' sicuramente un lavoro molto delicato. E' d'altra parte un lavoro che si doveva affrontare affinché l'obiettivo dell'omogeneità non restasse sulla carta. Proprio per la sua delicatezza, non è stato affrontato a tappe forzate, e non si pretende sia ancora un lavoro esaustivo.

Obiettivi del comune lavoro sul glossario: stabilire quali delle accezioni correnti dei principali termini tecnici (e in particolare di quelli più controversi) sono preferibili nel quadro di una generale sistemazione dei campi semantici nel linguaggio tecnico delle scienze umane. Per sottolineare la centralità del concetto di campo semantico, i termini sono presentati non in ordine alfabetico, ma raggruppati appunto in campi, che sono individuati da una sigla e da una cifra.
Per ciascuno dei termini del campo sono state proposte:

- una o più accezioni preferibili;

- una o più accezioni tollerate;

- una o più accezioni non tollerabili, perché generatrici di ambiguità.

In alcuni rari casi, sono stati proposti nuovi termini o espressioni, perché i termini in uso non erano, per questo o quel motivo, soddisfacenti.
Si afferma inoltre in via generale l'inopportunità di ricorrere ad anglicismi (o direttamente a termini inglesi) quando esistano accettabili equivalenti italiani.


GLOSSARIO della COLLANA 'metodologia delle scienze umane'

Premesse

Si giudica inopportuno usare termini inglesi (poll, survey, display) o calchi sull'inglese (rispondente) quando ci sono buoni equivalenti italiani: SONDAGGIO, INDAGINE, INCHIESTA, FIGURA, DIAGRAMMA, RAPPRESENTAZIONE, GRAFICO, INTERVISTATO.
Ad ogni modo, se si usano termini inglesi, essi devono essere flessi (declinati/coniugati).
Altrettanto per i termini delle altre lingue più note (latino, greco antico,francese, tedesco, spagnolo).

Sono da evitare anche i calchi sull'inglese dei calcolatori, come 'abblencare'.
Ci sono termini che hanno un'ampia gamma di significati correnti a seconda dei contesti disciplinari e degli approcci teorici: ad es. comprensione,ermeneutica, struttura, funzione. Si raccomanda che quando si usano termini del genere si specifichi (magari in nota) l'accezione in cui si intendono, ed eventualmente anche dei testi di riferimento — possibilmente i testi classici per quella tale accezione.

In questo glossario le accezioni sono presentate raggruppando i termini in campi semantici. Laddove può servire, si userà per comodità la distinzione di Ogden-Richards e di Popper fra:

mondo 1 (i referenti, ciò a cui si pensa o di cui si parla)

mondo 2 (il pensiero: concetti e asserti)

mondo 3 (il linguaggio: termini, espressioni, proposizioni; più in generale i segni; quindi la matrice dei dati).

Le sigle usate nell'organizzare e ordinare i campi semantici sono:

GEN: generalità;

EP: epistemologia classica;

SCM: struttura e costruzione di una matrice dei dati;

AM: analisi di una matrice dei dati.

GEN1:

epistemologia / gnoseologia / scienza

SCIENZA è una forma di conoscenza empirica istituzionalizzata, ottenuta mediante regole condivise da una comunità di specialisti.
GNOSEOLOGIA è la riflessione sulla conoscenza in generale.
EPISTEMOLOGIA è la riflessione sulla conoscenza scientifica.

GEN2:

metodo / metodologia / procedimento / procedura / tecnica

METODOLOGIA è termine da usare esclusivamente per le riflessioni su metodo e tecniche e per la relativa disciplina accademica. Non se ne accetta l'uso in luogo di‘metodo' o ‘tecniche'.
METODO è da riservare ad accezioni molto alte e generali, ai processi mentali che bilanciano mezzi e fini o scelgono fra tecniche pre-esistenti in vista di un obiettivo cognitivo. Si può usare peraltro in locuzioni già consolidate in altre discipline (es.: il metodo dei minimi quadrati).
PROCEDIMENTO è termine del linguaggio ordinario che si può usare in sensogenerico.
Con il termine TECNICA si intende un procedimento pre-confezionato, codificato e relativamente generale che non mette in discussione gli obiettivi della ricerca in cui è impiegato (es: le scale Likert, il test-retest, la correlazione di Pearson) [vedi oltre, campo SCM/AM: tecniche di raccolta / tecniche di analisi dei dati].
PROCEDURA è termine da usare per i passi più dettagliati e specifici di unatecnica.

GEN3:

inchiesta / indagine / ricerca / sondaggio

RICERCA è il termine più generale, che ha significati anche nel linguaggio comune, in filosofia, etc.
SONDAGGIO equivale all'inglese poll, cioè a una raccolta di opinioni su temicontingenti, non collegati a problematiche teoriche e talvolta scollegati anche fra loro. E' tipicamente eseguito su un campione (vedi campo GEN5) dell'intera popolazione di riferimento.
INDAGINE equivale all'inglese survey: nella maggior parte dei casi (ma nonnecessariamente) si avvale di questionari, e si distingue dal sondaggio per il fatto di esser collegata a una problematica teorica.
INDAGINE campionaria corrisponde all'inglese sample survey: si avvale diquestionari somministrati a un campione (abitualmente di individui), ed ècollegata a una problematica teorica.
Nel SONDAGGIO ESPLORATIVO invece abitualmente non si ricorre a piani dicampionamento.
L'INCHIESTA si rivolge a un problema di rilevanza sociale, spesso conl'obiettivo di fornire adeguato supporto cognitivo a un successivo intervento inteso a risolvere o quanto meno affrontare il problema stesso.
Proprio a causa delle caratteristiche ora menzionate, l'indagine spesso, el'inchiesta quasi sempre, si interessa a specifici gruppi o strati dellapopolazione, non a campioni della popolazione in generale.

GEN4:

caso / individuo / oggetto / soggetto / unità

UNITÀ è il terminegenerico che designa un insieme di elementi che hanno una o più caratteristichein comune. Quindi va usato solo al singolare: in una ricerca sugli italianiadulti, l'unità è l'italiano adulto, non ciascun italiano adulto).
CASO è un termine specifico, e individua qualcuno o qualcosa su cui si siano raccolte informazioni in modo sistematico: il titolare di un vettore-riga nella matrice dei dati [vedi campo SCM2]. Per questo motivo il referente di questo termine appartiene al mondo della matrice (mondo 3).
Il corrispondente di un caso nel mondo dei referenti (mondo 1) si può dire —a seconda dell'opportunità — elemento, individuo, oggetto, soggetto.
Si parla di oggetto quando ci si vuole riferire a un elemento nella suaspecificità e globalità, senza ridurlo ai suoi stati sulle variabili (ad es.quando interessa ricostruire la personalità di un individuo, o la cultura di un gruppo sociale.
In psicologia si usa abitualmente il termine Soggetto sia in luogo di 'caso'sia in luogo di 'oggetto'.

GEN5:

campione / popolazione / universo

L'insieme degli esemplari di una certa unità effettivamente presenti entro l'ambito scelto per una ricerca costituisce la POPOLAZIONE cui fa riferimento quella ricerca. Una popolazione è quindi composta da elementi tutti effettivamente indagati o indagabili nel corso di una ricerca.
CAMPIONE è un sotto-insieme degli elementi di una popolazione.
CAMPIONE CASUALE è un sotto-insieme degli elementi di una popolazioneselezionati seguendo una regola probabilistica.
Mentre il concetto di popolazione appartiene al mondo dei referenti (mondo 1), il concetto di universo appartiene al mondo del pensiero (mondo 2). UNIVERSO è infatti l'insieme di tutti i possibili elementi, passati, presenti e futuri, dell'unità in questione. Il numero di tali elementi è pertanto illimitato.
I teoremi e le formule della statistica induttiva assumono che tale numero sia infinito. I campioni vengono estratti da una popolazione, non da un universo, e i risultati ottenuti analizzando un campione possono essere attribuiti inferenzialmente solo alla relativa popolazione, non a un universo.

EP1:

congettura / generalizzazione (empirica)/ ipotesi / legge / modello /specificazione di un modello / teoria

Un asserto alla cui portata non sono posti limiti spaziali o temporali si dice LEGGE. In un'altra accezione, il termine 'legge' allude a un asserto che istituisce un legame necessario fra eventi o stati di un sistema.
Un asserto corroborato (o ritenuto tale) in più ambiti spazio-temporalmentelimitati che viene riproposto senza esplicite delimitazioni alla sua portata si dice generalizzazione (EMPIRICA).
IPOTESI è un asserto sottoposto a controllo empirico. Nelle scienze sociali ciò comporta che esso abbia una portata limitata nello spazio e nel tempo, perché per controllare un'ipotesi si devono dare definizioni operative delle proprietà contemplate, e nelle scienze umane le definizioni operative sono inevitabilmente contestuali.
Quando non si configura una procedura di controllo empirico dell'asserto èmeglio usare il termine congettura, proprio del linguaggio ordinario.
TEORIA è un asserto (o un sistema di asserti) già sottoposti o (almenopotenzialmente) sottoponibili a controllo empirico.
Si parla di teoria assiomatizzata se il rapporto fra gli asserti componenti una teoria è gerarchico e formalizzato: molti asserti (teoremi) sono logicamente derivabili da uno o pochi asserti (assiomi) di generalità maggiore.
MODELLO è la rappresentazione grafica di un'ipotesi o di una teoria. Per (grado di) SPECIFICAZIONE DI UN MODELLO si intende il grado in cui esso include le possibili cause del fenomeno che costituisce la variabiledipendente del modello stesso [Per un'altra accezione del termine ‘modello' vedi campo AM4]

EP2:

confermare/ controllare / corroborare / falsificare / mettere alla prova / testare / verificare

Per l'attività di confronto di un'ipotesi con la realtà il termine preferibile è CONTROLLARE (EMPIRICAMENTE); è pienamente accettabile l'espressione de linguaggio ordinario METTERE ALLA PROVA. Sono da evitare, in quanto implicano una petizione di principio circa l'esito del controllo, i termini FALSIFICARE, VERIFICARE.E' inoltre da evitare l'anglicismo TESTARE.
Per l'esito del controllo si può parlare di FALSIFICARE, VERIFICARE. Peraltro a quest'ultimo termine sono da preferire CONFERMARE, CORROBORARE (non tanto per il fatto che una verifica è impossibile — fatto che vale solo per improbabili asserti universali — ma perché il termine ‘verificare' è screditato dall'abuso fattone dai positivisti).

SCM1:

attributo / carattere / concetto / costrutto / dimensione / proprietà / tratto / variabile

PROPRIETÀ è un termine relativo al mondo dei referenti (mondo 1);
VARIABILE è il corrispondente della proprietà nella matrice dei dati (mondo3).
Ad una proprietà e ad una variabile corrisponde nel mondo del pensiero (mondo 2) un CONCETTO (di PROPRIETÀ).
Una VARIABILE LATENTE ha un'esistenza virtuale nella matrice dei dati, ed èricavabile attraverso particolari analisi (componenti principali, fattori,etc.). Al di fuori di questo caso, si può parlare di 'variabile' solo perun vettore-colonna nella matrice dei dati.
DIMENSIONE è qualcosa di più generale, che congloba varie proprietà continuee/o i relativi concetti. L'equivalente nella matrice dei dati è unacomponente o un fattore.
Sono da evitare i termini CARATTERE (usato dagli statistici senza distinguere fra mondo dei referenti e matrice dei dati), TRATTO (usato dagli psicologi preferibilmente per il mondo dei referenti), COSTRUTTO (usato in luogo di ‘concetto' prevalentemente dagli psicologi, e comunque in un quadro epistemologico neopositivista, che postula una rigida contrapposizione fra 'costrutto teorico' e 'termine osservativo'.
Il termine ATTRIBUTO è usato sia per concetti di proprietà (livello vettoriale: vedi oltre, campo SCM2) sia per concetti di classe, categoria,modalità (livello sub-vettoriale: vedi campo SCM2); è pertanto consigliabile riservarlo ai casi in cui una modalità è trasformata in variabile (dummy), cioè si passa dal livello sub-vettoriale a quello vettoriale).

SCM2:

cella / matrice / matrice dei dati / vettore

VETTORE è una sequenza ordinata di informazioni relative allo stesso referente.
In una MATRICE un fascio di vettori paralleli (aventi cioè referenti dello stesso tipo, e informazioni nella stessa sequenza) in riga si incrocia con un altro fascio di vettori paralleli in colonna.
Una CELLA si colloca all'incrocio fra due vettori, e quindi l'informazione che essa contiene ha un duplice referente: quello del vettore-riga e quello del vettore-colonna.
Per matrice dei dati si intende abitualmente una matrice i cui vettori-riga sono dei casi mentre i vettori-colonna sono delle variabili.
Entro una matrice si possono individuare cinque livelli:

- livello matriciale: tutto ciò che è riferibile all'intera matrice (quindi,nelle scienze umane, concetti come ricerca, popolazione, raccolta dei dati,analisi dei dati);

- livello multi-vettoriale: tutto ciò che si riferisce a più vettori, ma non all'intera matrice (quindi, nelle scienze umane, concetti come indice,campionamento, correlazione, tabulazione incrociata, analisi dei gruppi);

- livello vettoriale: tutto ciò che si riferisce a un solo vettore (quindi,nelle scienze umane, concetti come proprietà, variabile, indicatore,misurazione, definizione operativa, caso, profilo, distribuzione di frequenza, standardizzazione);

- livello multi-cellulare: tutto ciò che si riferisce a più celle, ma non a un intero vettore (quindi, nelle scienze umane, concetti come categoria, modalità, codice, percentuale, e procedure come la ricodifica e la COUNT di SPSS)

- livello cellulare: tutto ciò che si riferisce a una sola cella per volta:(quindi, nelle scienze umane, concetti come stato, dato, fedeltà).

Si sottolinea il fatto che molti — anche se certo non tutti — terminiabitualmente usati in ricerche che non fanno ricorso alla matrice dei datipossono essere ricondotti, con un adeguato lavoro analitico, a uno dei cinque livelli sopra definiti, e che questo lavoro analitico ha spesso effetti chiarificatori.

SCM3:

definizione operativa/operazionale / operativizzare/zazione /operazionalizzare/zazione

Una definizione operativa è un complesso di regole seguendo le quali ciascun singolo stato su una proprietà viene trasformata in dato, e di conseguenza l'intera proprietà viene trasformata in variabile.
Non si accetta l'aggettivo OPERAZIONALE (con i suoi derivati), perché è uncalco sull'inglese (operational). L'aggettivo OPERATIVA (con i suoiderivati) si è ormai affermato, anche perché più breve e maneggevole.

SCM4:

dato / informazione / risultato

DATO è il contenuto di una cella della matrice dei dati. La frase "i dati della mia ricerca" va intesa in questo senso. Non è invece il caso di riferirla, come talvolta si fa, ai RISULTATI di una o più analisi.
Se le informazioni raccolte da una ricerca non sono trattate per l'immissione in una matrice (cioè non si sono definite operativamente proprietà: vedi SCM3), è il caso di non chiamarle ‘dati' ma, appunto, informazioni.

SCM5:

affidabilità / attendibilità / fedeltà

ATTENDIBILITÀ,nell'accezione consolidata derivante dalla psicometria, indica il grado dicongruenza fra due o più vettori-colonna della matrice che intendono rilevare la stessa proprietà in condizioni differenti: tale differenza può consistere nello strumento (tecniche parallel forms, split half), nel momento della somministrazione (tecnica test-retest), nel giudice / osservatore / codificatore (tecniche inter-coder e simili). Si parla di (in)attendibilità quando si assume che le incongruenze fra i vettori abbiano natura accidentale.
FEDELTÀ è termine relativo al rapporto fra il singolo stato (mondo dei referenti) e il corrispondente dato (mondo della matrice) che si è prodottoapplicando la definizione operativa [per un'altra accezione del termine'fedeltà' vedi il campo AM4].
Si deve evitare di usare il termine AFFIDABILITÀ in modo intercambiabile con‘attendibilità', e riservarlo alla convinzione che i ricercatori si fanno/modificano, sulla base di ogni genere di risultanze (compresi, ovviamente, i coefficienti di attendibilità; ma non solo quelli) circa il grado di efficacia della loro definizione operativa, cioè la capacità di trasformare fedelmente gli stati in dati. E' quindi strettamente collegato (come mostra la radice) al concetto di fedeltà, e appartiene al mondo del pensiero.
Si giudica affidabile una certa definizione operativa se si pensa che produrrà dati (per lo più) fedeli. Ma si può cambiare idea alla luce di un coefficiente di attendibilità o di altre risultanze empiriche. Mentre un basso coefficiente di attendibilità è un forte indizio di scarsa fedeltà di almeno alcuni dati, un alto coefficiente di attendibilità non prova la fedeltà dei dati.

SCM6:

indicatore / proxy / validità

INDICATORE è un concetto che poniamo in rapporto di rappresentanza semantica con un altro, più generale (mondo del pensiero).
VALIDITÀ è un giudizio che diamo su quanto sia stretta tale rappresentanzasemantica, alla luce di una riflessione concettuale, e inoltre di ogni genere di risultanze empiriche, provenienti dal mondo dei referenti (dichiarazioni di esperti, di ricercatori, di collaboratori) o dal mondo della matrice (correlazioni fra vettori).
Alcuni ricercatori, quando non trovano convincenti indicatori dei concetti che vogliono investigare, ricorrono a una PROXY, cioè una proprietà con cui è risultata — o al limite si suppone — avere legami empirici (non semantici), con il concetto in questione.

SCM7:

indice / numero-indice / tasso / variabile derivata

INDICE è una combinazione di variabili che erano state (o possono essere) concepite come frutto dell'operativizzazione di indicatori dello stesso concetto. Se le variabili sono cardinali o quasi-cardinali, la loro combinazione sarà di solito effettuata tramite una formula matematica; se sono categoriali (ordinate o meno), la loro combinazione sarà di solito effettuata mediante una serie di prodotti logici.
Si accetta l'uso di INDICE (nel senso di NUMERO-INDICE) in locuzioni consolidate in statistica.
Molti di questi "indici" sono tassi (cioè frazioni il cui denominatore ha una funzione di normalizzazione; es: tasso di natalità), ed è preferibile chiamarli appunto TASSI.
Altri indici sono frutto di trasformazioni matematiche di variabili non tutte intese come indicatori dello stesso concetto (es.: densità, metri quadrati di verde pubblico per abitante). In tal caso è preferibile parlare di VARIABILI DERIVATE.

SCM8:

assegnazione / classificazione / conteggio / misurazione / operativizzazione/ registrazione / rilevazione / scaling / unità di misura

Quando non si allude a uno specifico modo di assegnare (direttamente) codici a un'informazione, non si parlerà di ‘misurare', ‘misurazione', ma di RILEVARE / RILEVAZIONE.

Per procedimenti più generali, si parlerà di OPERATIVIZZARE/ZAZIONE, oppureREGISTRARE / REGISTRAZIONE.
Se la proprietà rilevata è discreta, la procedura con cui si istituisconomodalità e/o si assegnano valori è la CLASSIFICAZIONE (proprietà categoriali), oppure il CONTEGGIO (proprietà quantitative).
Si può parlare di MISURAZIONE (DIRETTA) quando la proprietà rilevata ècontinua e ne esiste un'unità di misura. Per unità di misura si intende unaquantità standard della proprietà che si vuole misurare. L'unità di misurapuò anche consistere in una combinazione matematica di altre unità di misura(es.: chilometri all'ora).
Si userà il termine MISURAZIONE solo per il procedimento, e il termine MISURA per il risultato del procedimento.
E' del tutto improprio parlare di misurazione con proprietà discrete (anchese quantitative) o con variabili ordinali.
Tutte le altre procedure di rilevazione di proprietà continue (e quindi dicostruzione di scale di rapporti, di intervalli, auto-ancoranti, Likert) sidicono (procedure di) scaling e producono variabili ordinali, che spesso — con gradi diversi di distorsione —sono trattate come cardinali.
Le tecniche che assegnano valori agli stati elaborando in qualche forma vettori o (sotto-)matrici si dicono tecniche di ASSEGNAZIONE.
Fra queste, le tecniche di SCALING UNIDIMENSIONALE elaborano una(sotto-)matrice riordinando vettori-riga e/o vettori-colonna ed eventualmente eliminandone alcuni (es.: scale di Guttman), oppure applicando strumenti matematici (scale di Mokken, scale di Rasch). In ogni caso, i valori assegnati agli stati sono relativi ad una sola dimensione.
Le tecniche di SCALING MULTIDIMENSIONALE, invece, elaborano una(sotto-)matrice senza alcun assunto circa la dimensionalità dello spaziosemantico corrispondente.

SCM9:

categoria / codice / modalità / stato / valore

STATO è terminerelativo a uno specifico individuo (o a un esemplare di qualsiasi altra unità) e appartiene al mondo dei referenti.
CATEGORIA è termine più generale (riferito a tutti gli stati ritenuti uguali o assimilabili), e appartiene al mondo del pensiero; con riferimento alla matrice dei dati è usato in connessione con le operazioni di raccolta.
Il termine MODALITÀ talvolta è usato come sinonimo di ‘categoria', masarebbe preferibile usarlo con riferimento alle operazioni di analisi dei dati.
Il termine CODICE si riferisce a un carattere alfanumerico (di solito una cifra) assegnato a una modalità. Si usa anche il termine VALORE nella stessa accezione.

SCM10:

(proprietà/variabile) / categoriale (non ordinata) / classificazione / (proprietà/variabile) / classificatoria / (proprietà/variabile) qualitativa / scala nominale

Nel mondo dei referenti si parla di proprietà CATEGORIALE. Sono fortemente sconsigliati le espressioni ‘proprietà CLASSIFICATORIA' e ‘proprietà QUALITATIVA.'
La CLASSIFICAZIONE è soprattutto un procedimento intellettuale, ma anche il suo risultato (nel mondo del pensiero).
Nel mondo della matrice si parla di variabile CATEGORIALE, non di ‘variabile CLASSIFICATORIA' né di ‘variabile QUALITATIVA'. Non si accettano l'espressione ‘carattere sconnesso' né l'espressione SCALA NOMINALE.

SCM11:

(proprietà/variabile) ordinale / categoriale ordinata / classificazione ordinata / scala ordinale

L'espressione PROPRIETÀ CATEGORIALE ORDINATA è la più opportuna per designare una proprietà (mondo dei referenti) i cui stati sono classificabili in categorie ordinate.
L'espressione corrispondente nel mondo del pensiero è CLASSIFICAZIONE ORDINATA.
Le espressioni corrispondenti nel mondo della matrice sono VARIABILE ORDINALE oppure VARIABILE CATEGORIALE ORDINATA. Se interessa solo l'aspetto numerico, si può usare SCALA ORDINALE.

SCM12:

(proprietà) cardinale / continua / discreta / quantitativa / (scala) assoluta / cardinale / di differenze / di intervalli / metrica / quasi-cardinale / di rapporti / (variabile) continua / discreta / enumerata / a intervalli / metrica / quantitativa / quasi-cardinale

Una proprietà (mondo dei referenti) QUANTITATIVA è CONTINUA o DISCRETA (nel secondo caso ha stati ENUMERABILI). Non è il caso di parlare di proprietà cardinale, perché il termine presuppone un intervento dell'osservatore che fissa un cardine (lo zero) e un'unità di misura o di conto.
Da una proprietà continua misurabile con procedimento additivo deriva (nella matrice dei dati) una variabile METRICA (nel suo aspetto numerico, una SCALA METRICA).
Se il procedimento di misurazione è additivo e l'origine è convenzionale si parla di scalA di differenzE. Se il procedimento di rilevazione non è additivo e l'origine è assoluta (punto zero) si parla di scala di RAPPORTI. Se il procedimento di rilevazione non è additivo e l'origine è convenzionale si parla di scala di INTERVALLI (un procedimento di rilevazione non additivo è ad es. il confronto fra coppie di oggetti o di eventualità in termini di utilità).
Da una proprietà quantitativa discreta deriva (nella matrice dei dati ) una variabile ENUMERATA o QUANTITATIVA DISCRETA (nel suo aspetto numerico, una SCALA ASSOLUTA).
In sede di analisi dei dati, variabili metriche e variabili enumerate si possono entrambe dire variabili CARDINALI. Si può dire ‘cardinale' anche una variabile/scala non rilevata con un procedimento additivo, a condizione che si sia certi (per ragioni matematiche) che gli intervalli sono uguali, e che i risultati delle operazioni di formazione della variabile siano potenzialmente infiniti in intensione, cioè abbiano infinite possibili cifre decimali (es.: component scores, factor scores).
Si dicono QUASI-CARDINALI le variabili prodotte con tecniche di scaling che garantiscano l'ordine fra le categorie e consentano di assumere plausibilmente l'equidistanza fra coppie di categorie adiacenti (es.: differenziale semantico, termometro dei sentimenti, auto-collocazione destra-sinistra).
Dato che uno stato su una proprietà continua non può essere esattamente rappresentato in una matrice dei dati sotto forma di numero reale (perché occorrerebbero infinite cifre), l'espressione variabile continua è da evitarein quanto auto-contraddittoria.

SCM13:

livelli di scala / natura della proprietà / della variabile

La NATURA DELLA PROPRIETÀ (continua o discreta; categoriale ordinata o meno, etc.) insieme alle tecniche prescritte nella definizione operativa per rilevarla, determina la NATURA DELLA VARIABILE (categoriale, ordinale, cardinale, metrica, enumerata, quasi-cardinale). Non è opportuno designare con l'espressione LIVELLO DI SCALA la natura della variabile perché le variabili categoriali non sono scale in alcun significato del termine 'scala'.

SCM/AM:

tecniche di raccolta / tecniche di analisi dei dati

La principale distinzione fra tecniche è posta fra le tecniche di raccolta dei dati (o delle informazioni, se non si ricorre a una matrice dei dati) e le tecniche di analisi dei dati.
Le tecniche di analisi dei dati elaborano una matrice dei dati o una sua parte,oppure una matrice da essa derivata (ad es. una matrice di varianze e covarianze).

AM1:

descrittivo / inferenziale / significativo / tests di significatività

L'analisi dei dati provenienti da un campione può essere descrittiva, se non si intendegeneralizzare alla popolazione i risultati dell'analisi, oppure avere intenti inferenziali. In questo secondo caso, l'obiettivo è stimare il grado di fiducia con cui i risultati ottenuti analizzando i dati del campione possono essere attribuiti all'intera popolazione.
Tale grado di fiducia è valutato mediante TESTS DI SIGNIFICATIVITÀ. Il termine SIGNIFICATIVO si riferisce unicamente al risultato di tali tests, e non ha alcun rapporto con l'interesse e la rilevanza sostanziale dei risultati delle analisi.

AM2:

autonomia semantica / indipendenza semantica

L'autonomia semantica è una proprietà di una categoria, e consiste nella maggiore o minore possibilità di interpretarla senza far ricorso al significato dell'etichetta della variabile o delle altre categorie della variabile (ad es., la categoria 'casalinga' ha un'autonomia semantica maggiore della categoria ‘pienamente d'accordo': per interpretare la seconda, infatti, è necessario conoscere il testo della frase sottoposta agli intervistati). Il grado di autonomia semantica delle categorie di una variabile ha importanti conseguenze in sede di analisi dei dati.
L'indipendenza semantica è una proprietà di una coppia di proprietà/variabili, e consiste nel fatto che tra le due proprietà/variabili non intercorrano legami semantici, ma solo (eventualmente) legami empirici. Ad es. fra il sesso e il voto espresso c'è piena indipendenza semantica, mentre fra identificazione partitica e voto espresso c'è un'indipendenza semantica assai scarsa.
L'espressione ‘autonomia semantica' si colloca a livello multi-cellulare, mentre l'espressione ‘indipendenza semantica' si colloca a livello multi-vettoriale [vedi sopra, campo SCM2].

AM3:

associazione / attrazione / cograduazione / concordanza / correlazione / covariazione / indipendenza / interazione / relazione / repulsione

Relazione è il termine generale e generico per qualsiasi rapporto fra due o più variabili, esistente o meno, effettivo o potenziale. Se tale rapporto esiste si parla di associazione; se non esiste si parla di indipendenza. Questi tre termini si collocano a livello multi-vettoriale.
Un rapporto di associazione fra variabili categoriali non ordinate si dice CONCORDANZA.
Si parla di INTERAZIONE fra una modalità di una variabile categoriale e una modalità di un'altra variabile categoriale quando nella relativa cella di una tabella di contingenza le frequenze osservate sono apprezzabilmente diverse dalle frequenze attese. Quando le frequenze osservate sono superiori alle frequenze attese si parla anche di ATTRAZIONE fra le due modalità; quando le prime sono inferiori alle seconde si parla anche di REPULSIONE fra le modalità. Questi tre termini si collocano pertanto a livello cellulare.
Un rapporto di associazione fra variabili ordinali e/o cardinali si dice COVARIAZIONE.
Più in particolare, un rapporto di associazione fra variabili categoriali ordinate si dice COGRADUAZIONE.
Un rapporto di associazione fra variabili cardinali (o quasi-cardinali) si dice CORRELAZIONE.
Quindi 'covariazione' è un termine di genere, rispetto al quale 'cograduazione' e 'correlazione' designano due specie. Tutti tre questi termini si collocano a livello multi-vettoriale.

AM4:

adattamento / capacità predittiva / fedeltà / modello / parsimonia

Si definiscono modelli le tecniche di analisi dei dati che adottano assunti espliciti sui processi sottostanti ai dati osservati e sugli errori accidentali di rilevazione (ad es.la regressione, la path analysis, il LISREL, l'analisi fattoriale).
In questo senso le tecniche di analisi dei dati che non adottano tali assunti (ad es. l'analisi delle corrispondenze, l'analisi delle componenti principali, la correlazione canonica) non sono modelli [Per un'altra accezione del termine 'modello' vedi campo EP1]
I principali criteri di valutazione degli esiti dell'applicazione di una tecnica di analisi ad una matrice di dati (o a una sua parte) sono:
(BONTÀ DELL') ADATTAMENTO — in inglese (goodness of) fit — è la capacità di riprodurre l'intera matrice di dati (o la sua parte considerata) o una matrice di coefficienti che sintetizzano le relazioni fra variabili, fra stimoli, fra casi (similarità, correlazioni, covarianze, dissimilarità, distanze).
FEDELTA' è la capacità di un modello di riprodurre la struttura sottostante;il concetto postula una distinzione fra componenti sistematiche e componenti erratiche del processo che genera i dati.
CAPACITÀ PREDITTIVA è la capacità di riprodurre le varianze delle variabili dipendenti (e quindi si applica solo se una o più variabili sono considerate dipendenti). In un modello a variabili latenti, ‘capacità predittiva' è la misura in cui la conoscenza degli stati dei casi sulle variabili latenti permette di prevederne i valori sulle variabili osservate.
PARSIMONIA è il rapporto fra il numero di parametri risparmiati e il numero di quelli risparmiabili in un modello o rappresentazione.

AM5:

cross tabulation / incrocio / tabella di contingenza / tabella a doppia entrata / tabulazione incrociata

L'espressione TABULAZIONE INCROCIATA si riferisce a un'azione, a una tecnica, non al risultato.
Il risultato si dice TABELLA DI CONTINGENZA. E' da evitare TABELLA A DOPPIA ENTRATA perché è pesante, e implica la necessità di espressioni come ‘tabella a tripla entrata', etc.
Per ragioni di rapidità, si può usare INCROCIO sia per l'azione sia per il risultato.
CROSS TABULATION è da evitare sia per l'azione sia per il risultato, in quanto è un anglicismo non necessario.

AM6:

deviazione / deviazione standard / errore / residuo / scarto / scartoquadratico medio / scarto-tipo / scostamento /

standard deviationSi parla di SCARTO (o di SCOSTAMENTO) di un dato dalla media; non di DEVIAZIONE, che è un inutile calco sull'inglese.
La misura lineare (non quadratica) di dispersione di una distribuzione attorno alla sua media si dice SCARTO-TIPO o DEVIAZIONE STANDARD. Sono da evitare le espressioni SCARTO QUADRATICO MEDIO (perché pesante e fuorviante) e STANDARD DEVIATION.
Mentre il termine 'scarto' si colloca a livello cellulare, le espressioni'scarto-tipo' e ‘deviazione standard' si collocano a livello vettoriale.
In un diagramma a dispersione, la distanza in ordinata fra un punto e la retta di regressione si dice RESIDUO. Il termine ERRORE rivela un'impostazione determinista o, quanto meno, la convinzione che il proprio modello sia ben specificato.

AM7:

triangolo superiore/inferiore

Il TRIANGOLO SUPERIORE quella parte di una matrice speculare (ad es., una matrice di correlazione, o di varianze/covarianze) che si trova sopra-a-destra della diagonale principale.Il TRIANGOLO INFERIORE è quella parte di una matrice speculare che si trova sotto-a-sinistra della stessa.

AM8:

varianza spiegata / riprodotta

Per convenzione, il coefficiente di determinazione, e i suoi equivalenti nell'analisi della varianza, dei fattori etc., sono ritenuti misurare la proporzione della varianzadella variabile dipendente (o delle variabili osservate nell'analisi fattoriale) "spiegata" da quel particolare modello di regressione (o fattoriale). Dato che il valore di tali coefficienti è il risultato dell'applicazione di un algoritmo che non ha e non considera informazioni sulla stato della realtà, si ritiene assai preferibile parlare di proporzione di varianza riprodotta. Solo se si dichiara e si argomenta la tesi che l'esito dell'algoritmo rispecchia un effettivo processo causale nella realtà è legittimo parlare di proporzione di varianza spiegata.