Dieser Text ist Teil des Textes „Neustart der Menschlichkeit (Rebooting humanity)“
(Die Englische Version findet sich HIER)
Autor Nr. 1 (Gerd Doeben-Henisch)
Kontakt: cagent@cognitiveagent.org
(Start: 7.Juni 2024, Letzte Änderung: 9.Juni 2024)
Ausgangspunkt
Sprechen im Alltag bringt es mit sich, dass wir durch unsere Art und Weise zu sprechen, die Wahrnehmungen unseres Umgebung ordnen, allein durch unser Sprechen. Diese Ordnung findet durch das Denken statt, das sich im Sprechen manifestiert. Wie schon zuvor geschildert, ist die Fähigkeit zum Sprechen uns Menschen zwar angeboren, nicht aber die Art und Weise, wie wir unser Sprechen benutzen. Im Sprechen schaffen wir automatisch eine Ordnung, aber ob diese Ordnung tatsächlich den Gegebenheiten unserer Alltagswelt entspricht, erfordert eine zusätzliche Überprüfung. Diese Überprüfung geschieht aber nicht automatisch, wir müssen dies ausdrücklich wollen und konkret durchführen.
Überprüfbare Aussagen
Wenn man den Ausgangspunkt akzeptiert, dass sprachliche Äußerungen, die unser Denken möglich macht, im Ansatz zunächst ’nur gedacht‘ sind und einer zusätzlichen ‚Überprüfung im Alltag‘ bedürfen, um einen minimalen ‚Geltungsanspruch auf Zutreffen‘ im Alltag verdienen, dann kann man diese Grundidee als Ausgangspunkt für das Konzept einer ‚empirischen Überprüfbarkeit‘ benutzen, welches hier als einer von mehreren ‚Bausteinen‘ für das umfassendere Konzept einer ‚empirischen Theorie (ET)‘ gesehen wird.
Sprache ohne Zahlwörter
Hier einige Beispiele aus dem Alltag, mit denen einige Aspekte des Konzepts ‚empirische Überprüfbarkeit‘ erläutert werden können[1]:
- Fall 1: Es gibt ein Objekt mit bestimmten Eigenschaften, das die beteiligten Personen sinnlich wahrnehmen können. Dann kann eine Person A sagen: „Da gibt es ein Objekt X mit Eigenschaften Y“. Und eine andere Person B kann sagen: „Ja, ich stimme zu“.
- Fall 2: Ein bestimmtes Objekt X mit Eigenschaften Y kann von den beteiligten Personen sinnlich nicht wahrnehmen werden. Dann kann eine Person A sagen: „Das Objekt X mit Eigenschaften Y ist nicht da“. Und eine andere Person B kann sagen: „Ja, ich stimme zu“.
- Fall 3: Es gibt ein Objekt mit bestimmten Eigenschaften, das die beteiligten Personen sinnlich wahrnehmen können, das sie vorher noch nie gesehen haben. Dann kann eine Person A sagen: „Da gibt es ein Objekt mit Eigenschaften, das kenne ich noch nicht. Das ist für mich neu“. Und eine andere Person B kann dann sagen: „Ja, ich stimme zu“.
Die gemeinsame Grundstruktur aller drei Fälle ist, dass es mindestens zwei Menschen gibt, welche die ‚gleiche Sprache sprechen‘ und die sich in einer ‚gemeinsam geteilten Situation‘ im Alltag befinden. Ein Mensch — nennen wir ihn A — startet jeweils ein Gespräch mit einer ‚Aussage über ein Objekt mit Eigenschaften‘, wobei die Aussage je nach Situation variiert. In allen vier Fällen kann der angesprochene Mensch — nennen wir ihn hier B –den Aussagen von A ‚zustimmen‘.
Die drei Fälle unterscheiden sich z.B. darin, wie das Objekt ‚vorkommt‘: Im Fall 1 ist ein Objekt ‚einfach da‘, man kann es ‚wahrnehmen‘ und das Objekt erscheint als ‚bekannt‘. Im Fall 2 ist das Objekt bekannt, aber nicht da. Im Fall 3 gibt es auch ein Objekt, man kann es wahrnehmen, aber es ist ’nicht bekannt‘.
Für das konstruktive Gelingen des Feststellens einer Übereinstimmung, die zwischen mehreren Menschen Zustimmung findet, werden am Beispiel der drei Fälle folgende Elemente angenommen:
Die Teilnehmer verfügen
- über eine ’sinnliche Wahrnehmung‘, die Ereignisse der Umgebung dem Wahrnehmenden erkennbar macht.
- über ein ‚Gedächtnis‘, das Wahrgenommenes speichern kann.
- über die ‚Entscheidungsfähigkeit‘ darüber entscheiden zu können, ob entweder (i) das Wahrgenommene schon mal wahrgenommen wurde oder ob (ii) das Wahrgenommene etwas ‚Neues‘ ist oder ob (iii) ein Objekt ’nicht mehr da ist‘, was ‚vorher‘ da war.
- über eine hinreichend ähnliche ‚Bedeutungsbeziehung‘, welche die Menschen in die Lage versetzt, zwischen den Elementen der gesprochenen Sprache und den Elementen sowohl der Wahrnehmung wie auch der Erinnerung eine aktive Beziehung zu aktivieren, wodurch Sprachelemente auf Inhalte verweisen können und umgekehrt Inhalte auf Sprachelemente.
Nur wenn alle diese vier Komponenten [2] in jedem Menschen gegeben sind, der an der Situation beteiligt ist, kann der eine dem anderen sprachlich etwas über seine Wahrnehmung von Welt in einer Weise mitteilen, dass der andere zustimmen kann oder nicht. Fehlt eine der genannten Komponenten (Wahrnehmung, Gedächtnis, Entscheiden können, Bedeutungsbeziehung), ist die Prozedur des Feststellens einer Übereinstimmung bei der Benutzung eines sprachlichen Ausdrucks nicht möglich.
[1] Es gibt sehr viele unterschiedliche Fälle!
[2] Diese vier Konzepte (Wahrnehmung, Gedächtnis, Entscheiden können, Bedeutungsbeziehung) sind ‚aus sich heraus‘ nicht verständlich. Sie müssen im weiteren Verlauf durch einen geeigneten Kontext erklärt werden. Sie werden hier im aktuellen Konzept ‚überprüfbare Aussagen‘ in einem funktionalen Kontext benutzt, welcher das Konzept ‚überprüfbare Aussage‘ charakterisiert.
Sprache mit Zahlwörtern
In der Regel enthalten heute Alltagssprachen auch Zahlwörter (z.B. eins, zwei, 33, 4400, …, 1/2, 1/4, ), wenngleich mit unterschiedlichem Umfang.
Solche Zahlwörter beziehen sich in der Regel auf irgendwelche ‚Objekte‘ (z.B. drei Eier, 5 Rosen, 33 Kartoffeln, 4400 Einwohner, … 1/2 Pfund Mehl, 44 Liter Niederschlag in einer Stunde, …), die sich in einem bestimmten Raumgebiet befinden.
Eine nachvollziehbare Überprüfung hängt dann von folgenden Faktoren ab:
- Lässt sich die angegebene Anzahl oder Menge in diesem Raumgebiet direkt feststellen (es muss eine klare Zahl heraus kommen)?
- Falls die Anzahl oder die Menge zu groß ist, um sie in dem Raumgebiet direkt abschätzen zu können, gibt es dann ein nachvollziehbares Verfahren, mit dem dies möglich ist?
- Wie hoch ist der Zeitaufwand, um die Feststellung in dem Raumgebiet durchführen zu können (z.B. Minuten, Stunden, Tage, Wochen, …)?
Falls der notwendige Zeitaufwand immer größer wird, dann wird es immer schwerer, die Aussage für einen bestimmten Zeitpunkt zu machen (z.B. die Anzahl der Einwohner in einer Stadt).
Diese Beispiele lassen erkennen, dass die Frage der Überprüfung sehr schnell immer mehr Aspekte umfasst, die erfüllt sein müssen, damit die Überprüfbarkeit einer Aussage von allen Beteiligten nachvollzogen und akzeptiert werden kann.
Sprache mit Abstraktionen
Eine andere durchgehende Eigenschaft von Alltagssprachen ist das Phänomen, das sich im Kontext von Wahrnehmung und Gedächtnis (Speichern und Erinnern) automatisch abstrakte Strukturen bilden, die als solche auch in die Sprache abgebildet werden. Hier einfache Beispiele:
BILD : Vier Arten von Gegenständen, die jeweils als konkrete Beispiele einer abstrakten Art (Klasse) gesehen werden können.
Im Alltag haben wir für die wahrgenommenen Objekte der Art 1-4 jeweils ein Wort, obwohl die konkrete Vielfalt jedes Objekt anders aussehen lässt: Im Fall der Objekte der Gruppe 1 können wir von einer ‚Uhr‘ sprechen, im Fall von Gruppe 2 von einer ‚Tasse‘, bei 3 von ‚Kugelschreibern‘ und im Fall von 4 von ‚Computermäusen‘, kurz ‚Mäusen‘. wobei jeder aufgrund des Kontextes weiß, dass mit ‚Maus‘ hier keine biologische Maus gemeint ist sondern ein technisches Gerät im Kontext von Computern. Obwohl wir ’sinnlich‘ jeweils etwas ‚anderes‘ sehen, benutzen wir jeweils das ‚gleiche Wort‘. Das ‚eine Wort‘ steht dann für potentiell ‚viele konkrete Objekte‘, mit der Besonderheit, dass wir ‚implizit wissen‘, welches konkrete Objekt mit welchem Wort zu verknüpfen ist. Wären wir nicht dazu in der Lage, viele konkrete verschiedene Objekte jeweils mit ‚einem Wort‘ zu benennen, dann wären wir nicht nur außer Stande, so viele verschiedene Worte zu erfinden, wie wir bräuchten, sondern die Abstimmung untereinander würde vollständig aus dem Ruder laufen: wie sollten sich zwei verschiedene Menschen darauf einigen können, was sie ‚in gleicher Weise‘ wahrnehmen, wenn jedes Detail der Wahrnehmung zählen würde? Das gleiche Objekt kann ja je nach Sichtwinkel und Licht schon sehr verschieden aussehen.[1]
Das Geheimnis dieser Zuordnung von einem Wort zu vielen sinnlich unterschiedlichen Objekten liegt allerdings nicht in der Zuordnung von Worten zu Wissenselementen, sondern das Geheimnis liegt schon eine Stufe tiefer, dort, wo die Ereignisse der Wahrnehmung in Ereignisse des Gedächtnisses transformiert werden. Vereinfachend kann man sagen, dass die Vielzahl der sensorischen Ereignisse (visuell, akustisch, geschmacklich (gustatorisch), berührungsmäßig (taktil), …) nach ihrer Umwandlung in chemisch-physikalische Zustände von Nervenzellen Teile von neuronalen Signalflüssen werden, die vielfachen ‚Verarbeitungen‘ unterliegen. Im Ergebnis wird die ‚Vielfalt der Signale‘ in ‚abstrakte Strukturen‘ kondensiert, die als eine Art ‚Prototyp‘ funktionieren, die dann mit vielen konkreten ‚Varianten‘ verbunden sind. Es gibt also so etwas wie ‚Kerneigenschaften‘ die verschiedenen Wahrnehmungsereignissen wie ‚Tasse‘ ‚gemeinsam‘ sind, und dann viele ’sekundäre Eigenschaften‘, die auch auftreten können, aber eben nicht immer, die Kerneigenschaften schon. Im Fall der ‚Uhr‘ können z.B. die beiden Zeiger samt der kreisförmigen Anordnung von Marken solche ‚Kerneigenschaften‘ sein. Alles andere kann stark variieren. Außerdem bilden sich die ‚Muster von Kerneigenschaften und sekundären Eigenschaften‘ nicht einmalig, sondern als Teil von Prozessen mit vielfältigen Aspekten (z.B. möglichen Veränderungen, mögliche zeitlich parallelen Ereignissen usw., die als ‚Kontexte‘ funktionieren können (z.B. der Unterschied zwischen ‚technisch‘ und ‚biologisch‘ im Fall des der Bezeichnung ‚Maus‘).
Die Benutzung eines Wortes wie ‚Uhr‘ oder ‚Tasse‘ beinhaltet also — wie zuvor besprochen — einmal den Bezug zu Gedächtnisinhalten, zu Wahrnehmungsinhalten, zu erlernten Bedeutungsbeziehungen sowie die Fähigkeit, zu ‚entscheiden‘, welche der konkreten Wahrnehmungsmuster zu welchem gelernten ‚Prototypen‘ gehören. Je nachdem, wie diese Entscheidung ausfällt, sagen wir dann eben ‚Uhr‘ oder ‚Tasse‘ oder etwas entsprechend Anderes. Diese Fähigkeit unseres Gehirns zu ‚abstrahieren‘, indem es automatisch prototypisch ‚Muster‘ generiert, die exemplarisch für viele sensorisch verschiedene Einzelobjekte stehen können, ist für unser Denken und Sprechen im Alltag fundamental. Nur aufgrund dieser Abstraktionsfähigkeit kann Sprache funktionieren.
Nicht weniger beeindruckend ist es, dass diese grundlegenden ‚Abstraktionsfähigkeit‘ unseres Gehirns sich nicht auf die Beziehung zwischen den beiden Ebenen ’sinnliche Wahrnehmung‘ sowie ‚Speichern im Gedächtnis‘ beschränkt, sondern überall im Gedächtnis zwischen beliebigen Ebenen funktioniert. So haben wir kein Problem, verschiedene einzelne Uhren aufgrund von Eigenschaften weiter zu ‚gruppieren‘ z.B. zu ‚Armbanduhren‘ und ‚Wanduhren‘. Bei Tassen wissen wir, dass sie als Teil von ‚Trinkgefäßen‘ oder als Teil von ‚Küchengeschirr‘ gesehen werden können. Kugelschreiber ordnet man zu den ‚Schreibgeräten‘ und ‚Computermäuse‘ sind Teil von ‚Computerzubehör‘, usw.
Oft spricht man bei solchen Abstraktionsleistungen auch von ‚Kategorisierungen‘ oder ‚Klassenbildung‘ und die Objekte, die solchen Klassenbezeichnungen zugeordnet werden, bilden dann den ‚Klasseninhalt‘, wobei der ‚Umfang‘ einer Klasse ‚fließend‘ ist. Ständig können neue Objekte auftreten, die das Gehirn der einen oder anderen Klasse zuschlägt.
Bei dieser Vielfalt von ‚Abstraktionen‘ wundert es nicht, dass die Zuordnung einzelner Objekte zu einer dieser Klassen ‚fließend‘ ist, ‚unscharf‘. Bei den hunderten oder mehr verschiedenen Formen von Stühlen oder Tischen, die es mittlerweile gibt, ist es bisweilen schwierig, zu entscheiden, ist das noch ein ‚Stuhl‘ oder ein ‚Tisch‘ im ‚ursprünglichen Sinne‘ [2] oder eher ein ‚Designprodukt‘ auf der Suche nach einer neuen Form.
Für die leitende Frage nach der Überprüfbarkeit von sprachlichen Äußerungen, die Abstraktionen enthalten (und dies sind fast alle), ergibt sich nach den vorausgehenden Überlegungen, dass die ‚Bedeutung eines Wortes‘ bzw. dann auch die ‚Bedeutung einer sprachlichen Äußerung‘ niemals nur durch die Worte alleine ermitteln lässt, sondern fast immer nur durch den ‚Kontext‘, in dem die sprachliche Äußerung stattfindet. So, wie schon die Beispiele mit den ‚Zahlworten‘ aufleuchten lassen, so muss bei einer Bitte wie „Kannst Du mir meine Tasse rüber reichen“ sehr wohl wissen, welche der verschiedenen Tassen denn die ‚Tasse des Sprechers‘ war. Dies setzt die Situation voraus und ‚Wissen um die Vergangenheit dieser Situation‘: welche der möglichen Objekte hatte er als seine Tasse benutzt?[3]
Oder, wenn Menschen versuchen die Beschreibung einer Straße, eines Stadtviertels, eines einzelnen Hauses und dergleichen mit Sprache zu geben. Aufgrund der allgemeinen Bedeutungsstrukturen kann sich jeder Leser beim Lesen zwar ein ‚einigermaßen klares Bild‘ ‚in seinem Kopf‘ machen, aber nahezu alle Details, die nicht explizit beschrieben wurden (was im normalen Fall fast ausgeschlossen ist), sind im rekonstruierten ‚Bild im Kopf‘ des Lesers dann auch nicht vorhanden. Aufgrund des ‚Erfahrungswissens‘ der Sprachteilnehmer kann natürlich jeder sich sein ‚Bild im Kopf‘ zusätzlich ‚ausmalen‘.[4]
Will man als eine Gruppe von Menschen sicher sein, dass eine Beschreibung ‚hinreichend deutlich‘ ist, muss man für alle wichtigen Elemente des Berichts, die ‚vieldeutig‘ sind, zusätzliche Informationen bereit stellen. Man kann die beschriebenen Objekte z.B. gemeinsam besichtigen, untersuchen und/ oder man kann zusätzliche spezielle Beschreibungen erstellen, eventuell ergänzt um Bilder, Tonaufnahmen oder sonstigen Hinweisen.
Wenn es um Details geht, dann reicht die Alltagssprache alleine nicht aus. Es bedarf zusätzlich spezieller Maßnahmen.[5]
[1] Ein Problem, mit dem die maschinelle Bilderkennung von Anfang an zu kämpfen hatte und bis heute kämpft.
[2] Der ‚ursprüngliche‘ Sinn, also jenes Prinzip, das der Abstraktionsleistung ‚zugrunde‘ liegt, ist in jenen neuronalen Mechanismen zu suchen, die für diese Prototyp-Bildung zuständig sind. Die ‚innere Logik‘ dieser neuronalen Prozesse ist bislang noch nicht vollständig erforscht, aber ihre ‚Wirkung‘ kann beobachtet und analysieren. In der Psychologie gibt es seit den 1960iger Jahren viele Modellbildungen, die dieses Verhalten anzunähern versuchen, mit zum Teil beachtlichen Erfolgen.
[3] Algorithmen der generativen Künstlichen Intelligenz (wie z.B. chatGPT), die über keinen realen Kontext verfügen, die auch über kein ‚körperbasiertes Wissen‘ verfügen, versuchen das Problem dadurch zu lösen, dass sie extrem große Mengen von Worten durch die Zerlegung von Dokumenten in ihre Wortbestandteile samt möglichen Kontexte jedes Wortes so analysieren, dass sie über diese Wortdatenbank mögliche ‚formale Kontexte‘ erschließen, die sie dann als ‚Quasi-Bedeutungskontexte‘ fungieren. Bis zu einem gewissen Grad funktioniert dies mittlerweile recht gut, aber eben nur in einem abgeschlossen Wortraum (closed world).
[4] Ein bekanntes Beispiel aus dem Alltag hierzu ist der Unterschied, der entstehen kann, wenn jemand einen Roman liest, sich dazu Vorstellungen in seinem Kopf bilden, und irgendwann gibt es einen Film zum Roman: inwieweit korrespondieren dann die Vorstellungen, die man sich von einzelnen Personen gemacht hat, mit denen im Film?
[5] Einige kennen vielleicht noch Texte aus sogenannten ‚heiligen Schriften‘ einer Religion (z.B. die ‚Bibel‘). Das grundlegende Problem der ‚Vieldeutigkeit‘ von Sprache wird im Falle historischer Texte natürlich verstärkt. Mit dem zeitlichen Abstand verliert sich das Wissen um die jeweilige Alltagswelt, in der ein Text entstanden ist. Dann kommt bei älteren Texten meist ein Sprachproblem hinzu: die ursprünglichen Texte wie z.B. der Bibel waren in einem alten Hebräisch (‚Altes Testament‘) bzw. in einem alten Griechisch (Neues Testament‘) abgefasst, dessen Sprachgebrauch oft nicht mehr bekannt ist. Zusätzlich wurden diese Texte in unterschiedlichen Textformen abgefasst, beim Alten Testament zudem zu verschiedenen Zeiten, wobei Text auch immer wieder umgearbeitet worden sind (was vielfach auch noch damit verbunden ist, dass nicht klar ist, wer jeweils genau die Autoren waren). Unter diesen Randbedingungen eine ‚genaue‘ Bedeutung zu erschließen, ist mehr oder weniger eingeschränkt oder unmöglich. Dies mag erklären, warum in den ca. 2000 Jahren ‚Bibelauslegung‘ die Interpretationen zu allen Zeiten sehr unterschiedlich waren.