Seiten

  • Startseite
  • Impressum
  • Inhalt
  • MINT
  • Sprache
  • Soziales
  • Geist
  • Kunst
  • Gemischtes
  • Gedichte

Sonntag, 31. August 2014

Im Garten
 En la ĝardeno
 在花园里


DeutschEsperanto中文

Juhuuuu! / Huraaaa! / 耶耶!

Die lus­ti­ge Welt der Tie­re ...

La ga­ja mondo de l'ani­ma­loj ...

动物的快乐世界……

Donnerstag, 28. August 2014

xxx2string()-Methoden


Deutsch

Meiner Schwester zuliebe ist/war dieser Beitrag in neongrüner Schrift und auf transparentem Hintergrunde verfasst. :-)

Ich ar­bei­te der­zeit an ei­ner in­tel­li­gen­ten Such­ma­schi­ne (in PHP), die Da­ten aus al­len mei­nen Da­tei­en auf dem Rech­ner aus­liest und ver­wer­tet, und brau­che in die­sem Zu­sam­men­hang Funk­tio­nen, die Do­ku­men­te ver­schie­dens­ter For­ma­te (.doc, .docx, .html, .odt, .ods, .pdf, .ppt, .txt, .xls und .xml)[1] in rei­nen Text um­wan­deln. Und weil die­se Me­tho­den ganz sinn­voll sind, fol­gen sie nun (un­kom­men­tiert; wer ein biss­chen Ah­nung von In­fo hat, wird sie ver­ste­hen, und der Rest schau­te sich mei­ne Er­klärun­gen wohl so­wie­so nicht an). Ich sag's gleich im Vor­hin­ein: Die Funk­tio­nen ex­tra­hie­ren den Klar­text mal mehr und mal we­ni­ger gut, was so­wohl vom For­ma­te als auch von der Da­tei abhängt; ich tes­te im­mer noch an ih­nen her­um.

  1
  2
  3
  4
  5
  6
  7
  8
  9
 10
 11
 12
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 27
 28
 29
 30
 31
 32
 33
 34
 35
 36
 37
 38
 39
 40
 41
 42
 42
 43
 44
 45
 46
 47
 48
 49
 50
 51
 52
 53
 54
 55
 56
 57
 58
 59
 60
 61
 62
 63
 64
 65
 66
 67
 68
 69
 70
 71
 72
 73
 74
 75
 76
 77
 78
 79
 80
 81
 82
 83
 84
 85
 86
 87
 88
 89
 90
 91
 92
 93
 94
 95
 96
 97
 98
 99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
<?php
    function file2string($file){
        $filea = explode(".", $file);
        $type = $filea[count($filea)-1];
        $string = "";
        switch($type){
            case "doc": $string = doc2string($file); break;
            case "docx": $string = docx2string($file); break;
            case "html": $string = html2string($file); break;
            case "odt": $string = odt2string($file); break;
            case "ods": $string = ods2string($file); break;
            case "pdf": $string = pdf2string($file); break;
            case "ppt": $string = ppt2string($file); break;
            case "txt": $string = txt2string($file); break;            
            case "xls": $string = xls2string($file); break;
            case "xml": $string = xml2string($file); break;
        }
        return $string;
    }
    function doc2string($source){
        $str = file_get_contents($source);
        return $str;
    }
    function docx2string($source){
        $zip = new ZipArchive;
        $zip->open($source);
        $index = $zip->locateName('word/document.xml');
        $data = $zip->getFromIndex($index);
        $zip->close();
        $sxe = new SimpleXMLElement($data);
        $text = $sxe->xpath("//w:t");
        $text2 = "";
        foreach($text as $t)
        $text2 .= $t;
        return utf8_decode($text2);
    }
    function html2string($source){
        $source = file_get_contents($source);
        $source = html_entity_decode($source);
        $source = strip_tags($source);
        return utf8_decode($source);
    }
    function ods2string($source){
        $zip = new ZipArchive;
        $zip->open($source);
        $index = $zip->locateName('content.xml');
        $data = $zip->getFromIndex($index);
        $zip->close();
        $d = "‽";
        $data = str_replace("><", ">$d<", $data);
        $data = strip_tags($data);
        while(str_replace("$d$d", "$d", $data) !== $data){
            $data = str_replace("$d$d", "$d", $data);
        }
        $data = str_replace("$d", " ", $data);
        return utf8_decode($data);
    }
    function odt2string($source){
        $zip = new ZipArchive;
        $zip->open($source);
        $index = $zip->locateName('content.xml');
        $data = $zip->getFromIndex($index);
        $zip->close();
        return utf8_decode(strip_tags($data));
    }
    /**
     * @source: http://php.net/manual/de/ref.pdf.php#56492
     */
    function pdf2string($source){
        $fp = fopen($source, 'rb');
        $content = fread($fp, filesize($source));
        fclose($fp);
        $searchstart = 'stream';
        $searchend = 'endstream';
        $pdfText = '';
        $pos = 0;
        $pos2 = 0;
        $startpos = 0;
        while($pos !== false && $pos2 !== false){
            $pos = strpos($content, $searchstart, $startpos);
            $pos2 = strpos($content, $searchend, $startpos+1);
            if ($pos !== false && $pos2 !== false){
                if ($content[$pos] == 0x0d && $content[$pos+1] == 0x0a){
                    $pos += 2;
                }
                else if($content[$pos] == 0x0a){
                    $pos++;
                }
                if($content[$pos2-2] == 0x0d && $content[$pos2-1] == 0x0a){
                    $pos2 -= 2;
                }
                else if($content[$pos2-1] == 0x0a){
                    $pos2--;
                }
                $textsection = substr($content, $pos+strlen($searchstart)+2, $pos2-$pos-strlen($searchstart)-1);
                $data = @gzuncompress($textsection);
                $pdfText .= pdfExtractText($data);
                $startpos = $pos2 + strlen($searchend)-1;
            }
        }
        return preg_replace('/(\s)+/', ' ', $pdfText);
    }
    function ppt2string($source){
        $str = file_get_contents($source);
        if(strlen($str) < 3000000){
            return entferne_buchstabensalat($str);
        }
        else {
            return "";
        }
    }
    function txt2string($source){
        return file_get_contents($source);
    }
    function xml2string($source){
        $source = file_get_contents($source);
        $source = html_entity_decode($source);
        $source = strip_tags($source);
        return utf8_decode($source);
    }
    function xls2string($source){
        include_once 'phpexcel-master/Classes/PHPExcel/IOFactory.php';
        $objPHPExcel = PHPExcel_IOFactory::load($source);
        $sheetData = $objPHPExcel->getActiveSheet()->toArray(null,true,true,true);
        $output = "";
        $output .= "<table>";
        for($i = 1; $i < count($sheetData); $i++){
            $output .= "<tr>";
            for($j = 65; $j < 65+count($sheetData[$i]); $j++){
                $output .= "<td>".$sheetData[$i][chr($j)]."</td>";
            }
            $output .= "</tr>";
        }
        $d = "‽";
        $output = str_replace("><", ">$d<", $output);
        $output = strip_tags($output);
        $output = str_replace($d, " ", $output);
        unset($objPHPExcel);
        return utf8_decode($output);
    }
    function pdfExtractText($psData){
        if(!is_string($psData)){
            return '';
        }
        $text = '';
        $psData = str_replace('\)', '##ENDBRACKET##', $psData);
        $psData = str_replace('\]', '##ENDSBRACKET##', $psData);
        preg_match_all('/(T[wdcm*])[\s]*(\[([^\]]*)\]|\(([^\)]*)\))[\s]*Tj/si', $psData, $matches);
        for($i = 0; $i < sizeof($matches[0]); $i++){
            if($matches[3][$i] != ''){
                preg_match_all('/\(([^)]*)\)/si', $matches[3][$i], $subMatches);
                foreach ($subMatches[1] as $subMatch){
                    $text .= $subMatch;
                }
            }
            else if ($matches[4][$i] != ''){
                $text .= ($matches[1][$i] == 'Tc' ? ' ' : '') . $matches[4][$i];
            }
        }
        $trans = array( 
            '...'               =>    '…', 
            '\205'              =>    '…', 
            '\221'              =>    chr(145), 
            '\222'              =>    chr(146), 
            '\223'              =>    chr(147), 
            '\224'              =>    chr(148), 
            '\226'              =>    '-', 
            '\267'              =>    '•', 
            '\('                =>    '(', 
            '\['                =>    '[', 
            '##ENDBRACKET##'    =>    ')', 
            '##ENDSBRACKET##'   =>    ']', 
            chr(133)            =>    '-', 
            chr(141)            =>    chr(147), 
            chr(142)            =>    chr(148), 
            chr(143)            =>    chr(145), 
            chr(144)            =>    chr(146), 
        );
        $text = strtr($text, $trans);
        return $text;
    }
    function entferne_buchstabensalat($string){
        $array = array();
        for($i = 33; $i < 126; $i++){
            $array[] = chr($i);
        }
        $l = 10000;
        $m = 6000;
        $k = 0;
        $tilde = "";
        for($i = 0; $i < $l; $i++){
            $tilde .= "~";
        }
        while($k < 4){
            for($n = 0; $n < floor(strlen($string))/$l; $n++){
                $block = substr($string, $n*$l, $l);
                if(strlen(str_replace($array, "", $block)) > $m){
                    $string = substr($string, 0, $n*$l).$tilde.substr($string, ($n*$l)+$l);
                }
            }
            $string = str_replace($tilde, "", $string);
            $k++;
            $l = $l / 10;
            $m = $m / 10;
            $tilde = "";
            for($i = 0; $i < $l; $i++){
                $tilde .= "~";
            }
        }
        return $string;
    }
?>

[1].doc = Word Do­cu­ment
.docx = Of­fi­ce Open XML Do­cu­ment
.html = Hy­per­Text Mar­kup Lan­gua­ge
.odt = Open­Do­cu­ment Text
.ods = Open­Do­cu­ment Spreads­heet
.pdf = Por­ta­ble Do­cu­ment For­mat
.ppt = Po­wer­Point Pre­sen­ta­ti­on
.txt = Text fi­le
.xls = Ex­cel Spreads­heet
.xml = Ex­ten­si­ble Mar­kup Lan­gua­ge

Dienstag, 26. August 2014

漢字


Deutsch

Chi­ne­sisch (si­no­ti­be­tisch) und Ja­pa­nisch (al­ta­isch) sind zwar sprach­ge­schicht­lich ge­se­hen nicht mit­ein­an­der ver­wandt, be­nut­zen aber trotz­dem die glei­chen Schrift­zei­chen -- CJK-Ideo­gram­me, wie der In­for­ma­ti­ker sa­gen würde. Die Zei­chen kom­men aus Chi­na, wur­den aber später von den Ja­pa­nern (zusätz­lich zu ih­ren ei­ge­nen Schrif­zei­chen) über­nom­men.

Beim nach­fol­gen­den Text han­delt es sich um die chi­ne­si­sche Na­tio­nal­hym­ne ("Marsch der Frei­wil­li­gen") und die ja­pa­ni­sche Über­set­zung des­sel­ben.


Ja­pa­nisch Chi­ne­sisch
-----------------------------------------------
-----------------------------------------------
て!奴隷となることをまぬびとよ!
らが血肉こうたな長城を!
中華民族せまる、
ひとりが最後雄叫びをあげるだ。
て!て!て!
々すべてがつにして、
砲火をついてめ!
砲火をついてめ!
め!め!め!
來!不願做奴隸們!
們的血肉成我們長城
中華民族到了最危險的時候,
每個被迫著發出最後的吼聲。
來!來!來!
們萬衆一心
冒著人的炮火,前
冒著人的炮火,前
!前
-----------------------------------------------
-----------------------------------------------
Tate! Dorei to naru koto o nozomanu hitobito yo!
lái! Bù yuàn zuò núlì de rénmen!
Warera ga chiniku de kizukou aratana chōjō o!
men de xiěròu, zhú chéng wǒmen xīn de chángchéng!
Chūka minzoku ni saidai no kiki semaru,
Zhōnghuá mínzú dàole zuì wéixiǎn de shíhòu,
hitorihitori ga saigo no otakebi o ageru tokida.
měi gèrén bèi pòzhe fāchū zuìhòu de hǒushēng.
Tate! Tate! Tate!
lái! lái! lái!
Wareware subete ga kokoro o hitotsu ni shite,
men wànzhòng yīxīn,
teki no hōka o tsuite susume!
màozhe rén de pàohuǒ, qiánjìn!
Teki no hōka o tsuite susume!
Màozhe rén de pàohuǒ, qiánjìn!
Susume! Susume! Susume!
Qiánjìn! Qiánjìn! Jìn!


Schaut man sich die bei­den Tex­te an, stellt man fest, dass 37 der 108 Schrift­zei­chen (oh­ne Satz­zei­chen) über­ein­stim­men. Da es sich da­bei meist um wich­ti­ge Wörter han­delt, stellt sich die Fra­ge, ob ein Chi­ne­sisch­spre­cher den ja­pa­ni­schen Text sin­ner­fas­send le­sen kann und um­ge­kehrt. Um das zu ver­ste­hen, neh­men wir den ja­pa­ni­schen Text her und er­set­zen al­le ja­pa­ni­schen Zei­chen durch Aus­las­sungs­punk­te. Da­mit auch un­ser­eins das Gan­ze ver­steht, kommt noch ei­ne deut­sche Über­set­zung.
起…!奴隷………………望……人………!
我……血肉…築…新…長城…!
中華民族…最大…危機………、
一人…………最後…雄叫……………時…。
起…!起…!起…!
我……………心…一…………、
敵…砲火…………進…!
敵…砲火…………進…!
進…!進…!進…!
auf­ste­hen…!Skla­ven………………hof­fen……Men­schen………!
wir……Fleischbau­enneuChi­ne­si­sche Mau­er…!
Chinas Volkam größtenBe­dräng­nis………、
ein Mensch…………als letz­tesschrei­en……………Zeit…。
auf­ste­hen…!auf­ste­hen…!auf­ste­hen…!
wir……………Herzeins…………、
FeindKa­no­nen­feu­er…………hin­ein­ge­hen…!
FeindKa­no­nen­feu­er…………hin­ein­ge­hen…!
hin­ein­ge­hen…!hin­ein­ge­hen…!hin­ein­ge­hen…!
Die­se klingt ein we­nig so, als hörte man ein Funk­gerät mit schlech­tem Emp­fang. Zu­min­dest kann man erah­nen, worum es in dem Lie­de geht: Um Skla­ven, die auf­ste­hen und ei­ne neue Mau­er bau­en, um das chi­ne­si­sche Volk in größter Be­dräng­nis und um den Gang ins feind­li­che Ka­no­nen­feu­er. Kennt man den Kon­text, ver­steht man al­so als Chi­ne­se den In­halt des ja­pa­ni­schen Tex­tes (und dem­zu­fol­ge auch um­ge­kehrt). Die deut­sche Über­set­zung lau­tet übri­gens:
Steht auf! Al­le, die kei­ne Skla­ven mehr sein möchten!
Lasst uns aus un­se­rem Fleisch und Blut die neue Mau­er bau­en.
In größter Be­dräng­nis ist Chinas Volk.
Der Un­ter­drück­ten letz­ter Schrei ertönt:
Steht auf! Er­hebt Euch!
Ge­mein­sam wi­der das feind­li­che Ka­no­nen­feu­er, vor­an!
Ge­mein­sam wi­der das feind­li­che Ka­no­nen­feu­er, vor­an!
Vor­an! Vor­an! Vorwärts!

Chi­ne­si­sche Schrif­zei­chen heißen übri­gens so­wohl im Chi­ne­si­schen als auch im Ja­pa­ni­schen 漢字, nur wer­den sie im Chi­ne­si­schen Hànzì und im Ja­pa­ni­schen Kanji aus­ge­spro­chen, wor­an auch zu er­ken­nen ist, dass die ja­pa­ni­sche Aus­spra­che von der chi­ne­si­schen herrührt.

Montag, 25. August 2014

Lautverschiebungen im Deutschen


Deutsch

Laut­ver­schie­bun­gen (LV) sind Kon­so­nan­tenände­run­gen, die im Lau­fe der Ent­wick­lung ei­ner Spra­che auf­tre­ten können. Die Laut­ver­schie­bun­gen im Deut­schen sei­en an die­ser Stel­le kurz und bündig vor­ge­stellt.

1. Ger­ma­ni­sche Laut­ver­schie­bung / Grimm­sches Ge­setz
(Urin­do­ger­ma­nisch → Ur­ger­ma­nisch)
Fol­gen­de Kon­so­nan­ten wur­den ver­scho­ben:
bʰ → b → p → f
dʰ → d → t → þ
gʰ → g → k → h

zu be­ach­ten: während ei­ner LV wird je­der Kon­so­nant höchs­tens ein mal ver­scho­ben
Be­trof­fe­ne Spra­chen und Bei­spie­le:
Deutsch und Eng­lisch sind ger­ma­ni­sche Spra­chen, La­tein und Französisch sind ita­li­sche Spra­chen. Dem­zu­fol­ge hat die 1. LV nicht bei letz­te­ren statt­ge­fun­den. Dies ist deut­lich zu er­ken­nen an Wort­grup­pen wie Fisch, fish / pis­cis, pois­son (LV: *pisḱ- → *fis­kaz), Gast, guest / hos­tis, hôte (LV: *óstisgas­tiz) und Herz, heart / cor, cœur (LV: *ḗr*hertô), wor­an zu se­hen ist, dass bei den ger­ma­ni­schen Spra­chen je­weils ei­ne LV (p → f, gʰ → g und k → h) statt­ge­fun­den hat und bei den ita­li­schen der ur­sprüng­li­che/urin­do­ger­ma­ni­sche Kon­so­nant er­hal­ten blieb.

2. (Alt-)Hoch­deut­sche Laut­ver­schie­bung
(Ur­ger­ma­nisch → Alt­hoch­deutsch)
Fol­gen­de Kon­so­nan­ten wur­den ver­scho­ben:
    b → p → pf / (ff → f)
þ → d → t → ts / (ss → s)
    g → k → kx / (xx → x)

zu be­ach­ten: p kann zu pf oder zu ff ver­scho­ben wer­den, ff kann zu f ver­scho­ben wer­den
Be­trof­fe­ne Spra­chen und Bei­spie­le:
Die 2. LV hat nur noch beim Über­gang zum Alt­hoch­deut­schen statt­ge­fun­den. Dem­zu­fol­ge ist auch Eng­lisch nicht da­von be­trof­fen. Dies er­kennt man an Wort­paa­ren wie Bruder / brother (LV: *brōþērbruoder), Zaun / town (LV: *tūnązūn) und Schlaf / sleep (LV: *slēpazslāf), wor­an zu se­hen ist, dass beim Alt­hoch­deut­schen je­weils ei­ne LV (þ → d, t → ts und p → ff → f) statt­ge­fun­den hat und beim Eng­li­schen der ur­sprüng­li­che/ur­ger­ma­ni­sche Kon­so­nant er­hal­ten blieb.

3. Bin­nen­deut­sche Kon­so­nan­ten­schwächung
(Mit­tel­hoch­deutsch → Frühneu­hoch­deutsch)[1]
Fol­gen­de Kon­so­nan­ten wur­den ver­scho­ben:
p → b
t → d
k → g

zu be­ach­ten: es fin­den außer­dem die Ver­schie­bun­gen s → z und ʃ → ʒ statt.
Be­trof­fe­ne Spra­chen und Bei­spie­le:
Die 3. LV be­trifft vor­wie­gend die ost­mit­tel­deut­schen Dia­lek­te, ist aber über das ge­sam­te hoch­deut­sche Sprach­ge­biet ver­brei­tet. In der stan­dard­deut­schen (Schrift-)Spra­che hat sie nicht statt­ge­fun­den. Bei­spie­le sind Grabschen / Grapschen, Mudda / Mutter und gge / Mücke.
[1]Quel­le: http://ti­nyurl.com/n2tuz­pb

Die Übereinstimmung ... Ü #4


Deutsch

Die­ser Bei­trag ist die Fort­set­zung von Die Über­ein­stim­mung ... Ü #3.

Mir ist auf­ge­fal­len, dass Über­ein­stim­mung nicht ein­deu­tig de­fi­niert ist. Die Glei­chung, die ich bis jetzt ver­wen­det ha­be, be­rech­net die Über­ein­stim­mung ei­nes Tex­tes der Spra­che L1 mit ei­nem Ver­gleichs­text der Spra­che L2:


Da­ne­ben kann man aber auch die Über­ein­stim­mung zwei­er Tex­te der Spra­chen L1 und L2 er­mit­teln:


Um den ab­so­lu­ten und den re­la­ti­ven Feh­ler aus­zu­rech­nen, neh­men wir den al­le­man­ni­schen Bei­spiel­satz als Bei­spiel her (Quel­le: Wi­ki­pe­dia).
Sei­ne Kind­heit ver­leb­te He­bel während der Win­ter­mo­na­te in Hau­sen im Wie­sen­tal, wo sei­ne El­tern We­ber wa­ren. Im Som­mer ar­bei­te­ten die El­tern als Dienst­leu­te in ei­nem Bas­ler Pa­tri­zi­er-Haus.
Si­ni Chind­heit hät dr He­bel während dä Win­ter­monät z'Hu­u­se im Wie­se­dal voläbt, wo si­ni Älte­re Wäber gsi sin. Im Sum­mer hän d'Älte­re als Dienschtlüt in­em­ne Bas­ler Pa­tri­zi­er-Hu­us gschafft.
1. Formel:Ü̂ = 66,14%
2. Formel:Ü = 67,35%
     
absoluter Fehler:ΔÜ = |Ü̂ - Ü| = 1,21%
relativer Fehler:δÜ = ΔÜ / Ü = 1,80%
Je länger die Tex­te wer­den, de­sto größer wird theo­re­tisch der Feh­ler. Da­her sa­ge ich an die­ser Stel­le klipp und klar, dass ich die ers­te For­mel, al­so die Über­ein­stim­mung ei­nes Tex­tes mit ei­nem Ver­gleichs­text, ver­wen­de(te).

Sonntag, 24. August 2014

Der Brotschneidemaschinenkrümelpinsel


Deutsch

Der Brot­schnei­de­ma­schi­nen-krümel­pin­sel.

Auf Es­pe­ran­to hieße das Ding z. B. pan­tranĉil­eret­pe­ni­ko (frei über­setzt).
In der Küche mei­ner Fe­ri­enhütte ha­be ich die­ses pa­tent­verdächti­ge Uten­sil ent­deckt ...

Da­mit es ja nicht zu ei­ner Zweck­ent­frem­dung kommt, war es so­gar beid­sei­tig be­schrif­tet.

Die da­zu­gehöri­ge
Brot­schnei­de­ma­schi­ne.


Freitag, 22. August 2014

Die Übereinstimmung ... Ü #3


Deutsch

Die fol­gen­de Ta­bel­le zeigt noch ein­mal die Über­ein­stim­mun­gen aus den vor­he­ri­gen bei­den Bei­trägen so­wie den Zeit­raum, von vor wie vie­len Jah­ren bis vor wie vie­len Jah­ren die je­wei­li­ge Spra­che et­wa ge­spro­chen wur­de.

L1Ütmin in atmax in a
Urin­do­ger­ma­nisch0,350005400
Ur­ger­ma­nisch0,430004000
Alt­hoch­deutsch0,79502250
Mit­tel­hoch­deutsch0,85650950
Neu­hoch­deutsch100


Geht man da­von aus, dass die Funk­ti­on für das Al­ter ei­nes Texts in Abhängig­keit von sei­ner Über­ein­stim­mung zum heu­ti­gen Text li­ne­ar verläuft, so erhält man fol­gen­de For­mel:
t(Ü) = α ⋅ (1 - Ü)
Der An­tieg ist der Spra­chen­ko­ef­fi­zi­ent (α), wel­cher spe­zi­fisch für je­de Spra­che be­stimmt wer­den muss. Nimmt man die Wer­te aus der an­ge­ge­be­nen Ta­bel­le erhält man für den deut­schen Spra­chen­ko­ef­fi­zi­en­ten einen Mi­ni­mal- und einen Ma­xi­mal­wert:
αmin ≈ 65 ha und αmax ≈ 75 ha ⇒ α ≈ 70 ha ± 5 ha
Das Er­geb­nis der Funk­ti­on t(Ü) ist dem­zu­fol­ge ein In­ter­vall. Für den ur­ger­ma­ni­schen Text erhält man bspw. ein Al­ter von:
t(0,4) = (70 ± 5) ha ⋅ 0,6 = 42 ha ± 3 ha = [39 ha, 45 ha]
Die­ses Er­geb­nis über­lappt sich mit dem er­war­te­ten/rich­ti­gen Wert von [30 ha, 40 ha]. Möchte man nicht das Al­ter, son­dern die Ent­ste­hungs­zeit des Tex­tes, so rech­net man um:
T(Ü) = 20 ha - t(Ü)
Die 20 Jahr­hun­der­te (Hek­to­jah­re) rühren da­her, dass wir uns im 21. Jh. be­fin­den.

Donnerstag, 21. August 2014

HTML-Experiment #2


English

This post is just for ex­per­i­ment­ing with HTML. The ex­ample is a poll with one of the most im­port­ant ques­tions ever. Cer­tainly you are al­lowed to vote. :-D

Who is the coolest?



Montag, 18. August 2014

Von da, wo man von Kihné, Seiné und Pfárné spricht ...


Deutsch

Da ich hier ge­ra­de Ur­laub ma­che, gibt es einen klit­ze­klei­nen Ein­blick in die itz­gründi­sche1 Gram­ma­tik: Per­so­nal­pro­no­men und Sub­stan­ti­ve. Das Verb­sys­tem usf. sind sehr kom­pli­ziert, aber falls je­mand sein In­ter­es­se be­kun­den soll­te, stel­le ich es natürlich gern vor.

Personalpronomen2
unbetontbetont
Sg.ich

ár, si, és
iich
du
ár, si, és
Pl.m’r
ihr
si
mir
ihr
si

Substantive (Bsp.) und best. Artikel3
m.f.n.
Sg.N
G
D
A
d’r Mo
in Mo sei
in Mo
in Mo
di Fra
d’r Fra ihr
d’r Fra
di Fra
ás Kiind
in Kiind sei
in Kiind
ás Kiind
Pl.N
G
D
A
di Mánn’r
in Mánn’rné ihr
in Mánn’rné
di Mánn’r
di Fran4
in Frané ihr
in Frané
di Fran
di Kenn’r
in Kenn’rné ihr
in Kenn’rné
di Kenn’r

Und natürlich folgt noch ein selbst­gewähl­tes Sprach­bei­spiel:
Un’r Kihoos hot än Mocknschwamm géfrássn un etzé licht ár kitz­gro auf in Heerlé sei altn Kanébe.
Un­ser Ka­nin­chen hat einen Flie­gen­pilz ge­fres­sen und jetzt liegt es asch­grau auf dem al­ten So­fa des Großva­ters.
Da­zu noch ei­ni­ge ety­mo­lo­gi­sche An­mer­kun­gen:
  • Kihoos, d’r: der Kuh­ha­se; Be­zeich­nung für das Haus­ka­nin­chen bzw. den Stall­ha­sen, wel­cher früher mit Kühen zu­sam­men im Stall ge­hal­ten wur­de
  • Mocknschwamm, d’r: Kom­po­si­tum aus Mock (Flie­ge) und Schwamm (Pilz)
  • Heerlé, ás: Di­mi­nu­tiv von Heer (Herr); s. auch Frälé, ás für Großmut­ter
  • Kanébe, ás: Gal­li­zis­mus; vgl. nhd. Ka­na­pee

1Ge­nau­er: Ei­ne Mund­art der itz­gründi­schen Dia­lekt­grup­pe.
2Die Vo­ka­le mit Akut wer­den keh­li­ger (á) bzw. un­be­tont (é) ge­spro­chen.
3Der Ar­ti­kel d’r, di, ás (der, die, das) ist nicht zu ver­wech­seln mit dem De­mons­tra­tiv­pro­no­men dár, dii, dos (die­ser, die­se, die­ses), wel­cher ein ei­ge­nes Fle­xi­ons­pa­ra­dig­ma be­sitzt.
4Der Plu­ral Weiw’r ist (im­mer noch) ge­bräuch­li­cher als Fran.

Mittwoch, 13. August 2014

Astronaut
 Astronaŭto


DeutschEsperanto

Hal­lo al­ler­seits,
ich ha­be ei­ne tol­le In­ter­netsei­te ent­deckt, auf der man lus­ti­ge Bil­der ma­chen kann.

Ich grüße die Welt aus dem Al­le!

Noch ei­nes der vie­len wei­te­ren, die ich ge­macht ha­be, gibt's hier.

Sa­lu­ton ĉiu­flan­ke,
mi mal­kov­ris mo­jo­san in­ter­ret­paĝon, sur kio oni po­vas krei ga­jajn bil­dojn.

Mi sa­lu­tas la mondon el la uni­ver­so!

An­ko­raŭ unun de la mul­taj pluaj, kiojn mi kreis, ek­zis­tas ĉi tie.

Dienstag, 12. August 2014

Die Übereinstimmung ... Ü #2


Deutsch

Ich woll­te das jetzt nicht al­les in die Kom­men­ta­re zum letz­ten Bei­trag schrei­ben, al­so pack ich al­les in einen neu­en.
Die ur­ger­ma­ni­sche und die urin­do­ger­ma­ni­sche Über­set­zung (von mir selbst über­setzt, ver­mut­lich nicht ganz feh­ler­frei) zu un­se­rem ur­sprüng­lich mit­tel­ho­ch­e­dut­schen Ge­dich­te lau­ten:
Ϸū izi mīnaz, ek immi þīnaz:
Ϸas skalt þū wissaz wesaną.
Ϸū izi bislutanaz
In mīnammai hirtini:
Fraluzanaz isti sa slutilaz:
Ϸū mōst semla þar innanē wesaną.
Túh₂ h₁ési méynos, éǵh₂ h₁ésmi téynos:
Tósyo skelsi túh₂ weyto h₁sónts.
Túh₂ h₁ési h₁episklewto
En méyni ḱérdi:
Leuto h₁ésti só sklewdila:
Túh₂ mōdsi h₁eymēi̯es tósmi entós h₁sónts.
... und lie­fern die fol­gen­den Über­ein­stim­mun­gen:
L1Ü in %
Ur­ger­ma­nisch41
Urin­do­ger­ma­nisch29
In ei­nem Dia­gramm dar­ge­stellt se­hen die Über­ein­stim­mun­gen in Abhängig­keit von den Sprach­stu­fen des Deut­schen so aus:


Zum Ver­gleich ha­be ich im In­ter­net auch noch ei­ne eng­li­sche und ei­ne hoch­chi­ne­si­sche Über­set­zung ge­sucht.
You are mine, I am thine:
Of that you can be sure.
You are locked up
In my heart:
Lost is the little key:
You must be in there forever.
(Quelle: http://tinyurl.com/o7lqcyf)
你是我的,我是你的:
你要确信不疑。
你被关闭
在我的心窝里:
小钥匙已丢失:
你永远关在我的心窝里。
(Quelle: http://tinyurl.com/prkrk7c)
Nǐ shì wǒ de, wǒ shì nǐ de:
Nǐ yào quèxìn bù yí.
Nǐ bèi guānbì
Zài wǒ de xīnwō li:
Xiǎo yàoshi yǐ diūshī:
Nǐ yǒngyuǎn guān zài wǒ de xīnwō li.
 
Die Über­ein­stim­mun­gen mit dem neu­hoch­deut­schen Text als Ver­gleichs­text sind fol­gen­de:
L1Ü in %
Eng­lisch35
Hoch­chi­ne­sisch24
Eng­lisch ist mit 35% natürlich näher am Deut­schen dran als das Chi­ne­si­sche mit 24%, wel­ches nicht mit dem Deut­schen ver­wandt ist. Eng­lisch und Deutsch sind bei­de west­ger­ma­ni­sche Spra­chen, d. h. stam­men bei­de vom ur­ger­ma­ni­schen ab. Ei­ne wei­te­re west­ger­ma­ni­sche Spra­che ist das Nie­derländi­sche.
Je bent van mij, ik ben van jou:
Van u zal er zeker.
U wordt besloten
In mijn hart:
Lost is het sleuteltje:
Je moet altijd binnen te zijn.
(Quelle: http://tinyurl.com/pzzw5bt)
Nimmt man jetzt den hoch­deut­schen, eng­li­schen und nie­derländi­schen Text her und setzt sie mit dem ur­ger­ma­ni­schen Text als Ver­gleichs­text in die For­mel ein, so erhält man fol­gen­de Über­ein­stim­mun­gen zur ge­mein­sa­men Ur­spra­che:
L1Ü in %
Deutsch43
Eng­lisch32
Nie­derländisch35
Die west­ger­ma­ni­schen Ab­le­ger­spra­chen ha­ben sich (zu­min­dest dem Ge­dichts­bei­spiel nach) un­ter­schied­lich stark von ih­rer ge­mein­sa­men Ur­spra­che, dem Ur­ger­ma­ni­schen, we­g­ent­wi­ckelt.

Montag, 11. August 2014

Die Übereinstimmung ... Ü


Deutsch

Es­pe­ran­to ist zwar ei­ne Plan­spra­che, un­ter­liegt aber auch dem ste­ti­gen Wan­del, dem ge­spro­che­ne Spra­chen im Lau­fe der Zeit un­ter­lie­gen. Die fol­gen­de Stro­phe ent­stammt ei­nem Lied, wel­ches Za­men­hof, der Schaf­fer Es­pe­ran­tos, in frühen Jah­ren schrieb. Es ist in Ure­s­pe­ran­to[1] von 1878 (Ei­gen­bez.: Ling­we un­i­wer­sa­la; epo.: Pra-Es­pe­ran­to) ver­fasst.
Malamikete de las nacjes,
Kadó, kadó, jam temp' está;
La tot' homoze in familje
Konunigare so debá.
Die­sel­be Stro­phe im Ure­s­pe­ran­to von 1881 (Ei­gen­bez.: Ling­vo uni­ver­sa­la) lau­tet wie folgt:
Malmiketo de la nacjoj,
Kadó, kadó, jam temp' esté;
La tot' homozo in familjo
Konunigi sol debé.
Und schließlich der Ver­gleich zur endgülti­gen und heu­ti­gen Ver­si­on von Es­pe­ran­to:
Malamikeco de la nacioj,
Falu, falu, jam temp' estas;
La tuta homaro en familion
Kununuigi sin devas.
Das war aber noch nicht al­les. Um alt­klin­gen­de Pas­sa­gen in Es­pe­ran­to schrei­ben zu können, wur­de ei­ne wei­te­re Va­ri­an­te von Es­pe­ran­to kre­i­ert; ge­nannt ar­chai­sches Es­pe­ran­to (Ei­gen­bez.: ar­cai­cam Es­pe­ran­tom; epo.: ar­kai­ka Es­pe­ran­to).
Malamiquetzom natzioyd,
Phalu, phalu, yamen temp' estat;
Tutam homarom in unun  phamilion
Cumunuiugui sihin dewat.
Von Es­pe­ran­to ab­ge­lei­te­te Spra­chen und Va­ri­an­ten be­zeich­net man als Es­pe­ran­ti­den. Und da die­se Spra­chen so­gar ih­re ei­ge­ne Be­zeich­nung ha­ben, liegt die Ver­mu­tung na­he, dass es da­von noch ei­ne gan­ze Rei­he gibt. Der ver­brei­tets­te Es­pe­ran­tid ist Ido.
Enemiko de la nacioni,
Falez, falez, ja temp' esas;
Tota homaro en familio
Kununigar devas.
Um zu zei­gen, wie ähn­lich sich all die­se Es­pe­ran­to-Va­ri­an­ten sind, kommt nun der glei­che Text in ei­ner an­de­ren, nicht mit Es­pe­ran­to ver­wand­ten Plan­spra­che, in In­ter­lin­gua:
Inamicitate del nationes,
Falle, falle, jam tempore esse;
La integre humanitate in un familia
Junger se debe.
Und schlus­send­lich das Gan­ze auf Eng­lisch als Über­set­zung:
Enmity of nations,
Fall, fall, it is time;
All humanity in a family
Must unite.
Die Über­ein­stim­mung ei­nes Tex­tes zum Es­pean­to-Text be­rech­ne ich mit die­ser For­mel[2]:
Dar­aus er­ge­ben sich die Über­ein­stim­mun­gen:
L1Ü in %
Ure­s­pe­ran­to (1878)60.828664799253
Ure­s­pe­ran­to (1881)69.126984126984
Es­pe­ran­to100
ar­chai­sches Es­pe­ran­to47.010582010582
Ido71.211484593838
In­ter­lin­gua37.597001763668
Eng­lisch27.202380952381
Man sieht, dass das Ure­s­pe­ran­to und Ido die größten Über­ein­stim­mun­gen mit dem heu­ti­gen Es­pe­ran­to ha­ben. Das liegt na­he, da Ure­s­pe­ran­to der Vorläufer und Ido ei­ne Ab­lei­tung von Es­pe­ran­to ist. Das ar­chai­sche Es­pe­ran­to soll be­wusst et­was an­ders aus­se­hen als das nor­ma­le Es­pe­ran­to, aber trotz­dem für einen Es­pe­ran­to­spre­cher er­kenn­bar sein. In­ter­lin­gua und Eng­lisch sind nicht mit Es­pe­ran­to ver­wandt, wes­we­gen sie die kleins­ten Über­ein­stim­mun­gen auf­wei­sen, wo­bei In­ter­lin­gua und Es­pe­ran­to bei­de Plan­spra­chen sind, die nach ei­nem ähn­li­chen Prin­zip ent­wi­ckelt wur­den.

Nun kann man die glei­che For­mel ver­wen­den, um die pro­zen­tua­len Über­ein­stim­mungn vom Alt- und Mit­tel­hoch­deut­schen mit dem Neu­hoch­deut­schen zu er­rech­nen. Als Text­grund­la­ge dient ein Ge­dicht von Walt­her von der Vo­gel­wei­de, wel­ches von ihm natürlich auf Mit­tel­hoch­deutsch ver­fasst wur­de.
Dû bist mîn, ich bin dîn:
Des solt dû gewis sîn.
Dû bist beslozzen
In mînem herzen:
Verlorn ist das slüzzelîn:
Dû muost immer drinne sîn.
Ins heu­ti­ge Hoch­deutsch übert­ra­gen lau­tet es wie folgt:
Du bist mein, ich bin dein:
Des sollst du gewiss sein.
Du bist beschlossen
In meinem Herzen:
Verloren ist das Schlüsselein:
Du musst immer drinnen sein.
Die alt­hoch­deut­sche Über­set­zung ist von mir; sie könn­te dem­zu­fol­ge Feh­ler ent­hal­ten.
Dū bist mīn, ih bim dīn:
Dës sculis dū giwis sīn.
Dū bist bislozan
In mīnemu herza:
Firlosan ist daȥ sluzzilīn:
Dū muazis iomēr dār innana sīn.
Wen­det man die For­mel auf die­se drei Tex­te mit dem neu­hoch­deut­schen Text als Ver­gleich­spa­ra­me­ter an (oh­ne Rück­sicht auf Dia­kri­ti­ka), so erhält man fol­gen­de Über­ein­stim­mun­gen:
L1Ü in %
Alt­hoch­deutsch71.241830065359
Mit­tel­hoch­deutsch84.313725490196
Neu­hoch­deutsch100
Die­se Bei­spie­le sind zwar noch kein Be­weis dafür, dass Vor­for­men von Spra­chen sich im Lau­fe der Zeit pro­zen­tu­al im­mer näher an die heu­ti­ge Form der Spra­che annähern, aber die Ver­mu­tung liegt zu­min­dest na­he.
[1] im all­ge­mei­nen Sprach­ge­brauch nennt man Ur­spra­chen auch Pro­to-Spra­chen (vgl. Eng­lisch) → Pro­to-Es­pe­ran­to
[2] Er­klärung: Die Über­ein­stim­mung von je­dem Wort mit sei­nem Äqui­va­lent im Ver­gleichs­text wird auf­sum­miert und an­sch­ließend durch die Ge­samt­zahl der Wörter ge­teilt. Exis­tiert in ei­ner der bei­den Spra­chen kein Äqui­val­ent­wort (das ist häufig bei Ar­ti­keln der Fall), dann wird mit dem lee­ren Wort ver­gli­chen; ist die Wort­rei­hen­fol­ge in den bei­den Spra­chen ver­schie­den (z. B. bei Eng­lisch), so wer­den die Wörter für den Ver­gleich ent­spre­chend um­ge­stellt; be­steht ein Wort im Ver­gleichs­text aus zwei Wörtern, so wird die­ses wie ein Wort und das Leer­zei­chen wie ein Ex­tra­buch­sta­be be­han­delt. Groß- und Klein­schrei­bung wird nicht be­ach­tet.