2. TK-Exkurs:
Anzahl, Größe und Beziehungen der Textdateien und Textdateienkategorien
Ich gehe bekanntlich von zwei auch
Textkklassen ( )
genannten Textdateienkategoriengruppen ( )
aus: A
und B:
Textdateienkategoriengruppe
A
mit 883 Textdateien (37,32%) |
Textdateienkategoriengruppe
B
mit 1483 Textdateien (62,68%) |
Jede dieser Textdateienkategoriengruppe
besteht aus vier auch Textordnungen ( )
genannten Textdateienkategorien.
In diesem 2. TDK-Exkurs werden die Textdateien dieser insgesamt
acht Textdateienkategorien hinsichtlich ihrer
Anzahl, ihrer Größe, ihrer Kategoriezugehörigkeit
und ihrer Kombinationsmöglichkeiten näher
untersucht.
|
2.1)
Textdateien nach Anzahl, Kategoriezugehörigkeit und Kombinationsmöglichkeiten
(A)
Was den Zugriff auf die Seiten angeht, so läßt sich
feststellen, daß die Seiten der Kategorien Verzeichnisse
und Navigatoren
annähernd 20% (genau: 22,87%  )
ausmachen und rund 80% der Seiten meiner Webpräsenz zugänglich
machen, nämlich die der Kategorien 1.
Grad, 2. Grad, 3.
Grad, 4. Grad, Zitate,
Rest. Diesen Aspekt nenne
ich den Zugriffsaspekt.
(B)
Gemäß der Pareto-Verteilung (20/80-Regel)
konstatiere ich, daß die von mir als bedeutungsvoll im Sinne
eigener Autorenschaft ausgewählten Seiten annähernd
20% umfassen und 80% des Inhalts meiner Webpräsenz bedeuten, während
die übrigen Seiten fast genau 80% umfassen und 20% des Inhalts
meiner Webpräsenz bedeuten. Ich nenne diesen Aspekt den Bedeutungsaspekt.
(C)
Nun könnte man sich als Aspekt selbstverständlich einen Mix
aus Zugriff ( )
und Bedeutung ( )
vorstellen. So ergeben sich sinnvollerweise folgende Varianten: die Kategorien
1. Grad und Zitate
mit 21,98% ( )
gegenüber dem Rest von 78,02% ( ),
die Kategorien 1. Grad und Navigatoren
mit 21,51 % ( )
gegenüber dem Rest von 78,49% ( )
und die Kategorien 1. Grad, 2.
Grad und Verzeichnisse
mit 22,52% ( )
gegenüber dem Rest von 77,48% ( ).
Der Zugriff/Bedeutung-Mix ist deshalb sehr sinnvoll, weil Zugriff
und Bedeutung gut kooperieren, wie uns ja auch der Gebrauch
von Büchern immer wieder zeigt. Wer liest schon gern Bücher
ohne Seitenzahlen und ohne Inhaltsverzeichnis? Auf Quellen- und Literaturhinweise
sowie deren Verzeichnisse kann man, falls man kein Wissenschaftler
ist, verzichten (wenn auch ungern), aber wohl kaum auf Seitenzahlen und
ein Inhaltsverzeichnis.
|
 |
|
|
(D)
Bezöge man die Anzahl und Größe der Textdateien
nur aufeinander, was ich bisher aus Gründen der Aspekte Zugriff
( ),
Bedeutung ( )
und Zugriff/Bedeutung-Mix ( )
unterlassen habe, ergäbe sich vielleicht ebenfalls eine Pareto-Verteilung
(20/80-Regel), weil erwartungsgemäß die größten
20% aller Seiten 80% der derzeit etwa 126,600 MB umfassenden Größe
aller Textdateien ausmachen, also 101,280 MB umfassen könnten. Von
den derzeit insgesamt 2366 Seiten meiner Webpräsenz könnten
also die größten 473 Seiten 101,280 MB und die restlichen 1893
Seiten 25,320 MB umfassen. So könnte doch die Hypothese lauten. Bei
meinem Internetangebot hat sie sich zwar nicht exakt bestätigt -
denn: es umfassen die größten 473 (20%) meiner Textdateien
111,552 MB und damit 88,11% und die kleinsten 1893 (80%) meiner Textdateien
15,048 MB und damit 11,89% -, aber mit einer entsprechenden Nachrüstung
großer Textdateien und intensiverer Verkopplung von Vielfalt, Ungleichheit
und Abweichungsverstärkung ( )
dürfte sich die Pareto-Verteilung (20/80-Regel)
vielleicht noch erreichen lassen. Doch der Größeaspekt
ist in dieser Hinsicht nicht so wichtig, schon gar nicht für die
Suchmaschinen.
(E)
Interessant ist, daß die von mir unter dem Aspekt Anzahl-Größe-Verhältnis
( )
angenommene Pareto-Verteilung (20/80-Regel) ihre
20/80-Scheidegrenze ungefähr an der Stelle hat, wo sich
auch die Größendurchschnittstextdatei befindet. Die
größten 473 Textdateien (rd. 20% von 2366 Textdateien)
trennen sich von den restlichen 1893 Textdateien (rd. 80% von 2366
Textdateien) also ungefähr da, wo sich die Größendurchschnittstextdatei
befindet, die wiederum die Grenze bildet zu denen, die entweder zu den kleineren
80% oder zu den größeren 20% gehören. Der Unterschied zwischen
diesen beiden Grenzen beträgt nur 2 Dateien (0,85% von
2366 Dateien) bzw. 0,104 MB (0,08% von 126,600 MB). Ermittelt wird die Größendurchschnittstextdatei,
indem die Größe aller Textdateien (126,600 MB bzw. 126600 KB)
durch die Anzahl aller Textdateien (2366) geteilt wird. 126600 KB geteilt
durch 2366 ergibt 53,50803043 KB. Die Textdatei, die dieser Durchschnittsgröße
am nächsten kommt, ist:
Von den Textdateien sind 19,86% (470 von 2366) größer
und 80,09% (1895 von 2366) kleiner als die Größendurchschnittstextdatei.
Die Textdateien, die größer sind als die Größendurchschnittstextdatei,
umfassen 111,393 MB, also 87,99% von 126,600 MB (100%), und die Textdateien,
die kleiner sind als die Größendurchschnittstextdatei,
umfassen 15,148 MB, also 11,97% von 126,600 MB (100%). Festzuhalten bleibt
jedenfalls, daß die Größendurchschnittstextdatei jene
19,86% und 80,09% voneinander trennt.
(F)
Das Verhältnis der Anzahl der Textdateien zu der Anzahl der eigen-externen
(also zu meinem Webangebot gehörigen und von außerhalb der
Zeiltextdatei kommenden) Seitenverweise ist ebenfalls sehr aussagekräftig
( ),
obwohl man auch diesen Aspekt nicht losgelöst von den anderen
Aspekten (   )
beurteilen sollte. Gemäß der Pareto-Verteilung
(20/80-Regel) sollten also 20% aller Textdateien 80% aller
eigen-externen Links (EEL) auf sich ziehen; und
gemäß der letzten Aktualisierung (! !)
verweisen in meinem Webangebot 77,65% ( )
aller eigen-externen Links ( )
auf 20% aller Textdateien bzw. 80% aller eigen-externen Links
auf 22,49% ( )
aller Textdateien. 
Fazit aus dem bisher Gesagten.
Ob und, wenn ja, wie die Pareto-Verteilung
(20/80-Regel) mein Webangebot betrifft, mag vielleicht folgende
Tabelle verdeutlichen:
| Aspekt | Verteilung
(in %) in Anlehnung an die Pareto-Verteilung (20/80-Regel) | Abweichung
(in %) von der Pareto-Verteilung (20/80-Regel) | (A) | Zugriff
 |
22,87/78,13 |
2,87 |
(B) | Bedeutung
|
28,66/71,34
21,98/78,02
28,78/71,22
Durchschnitt: 26,47/73,53 |
|
8,66
1,98
8,78
|
(C) |
Zugriff/Bedeutung-Mix
|
21,51/78,49
28,32/71,68
22,52/77,48
23,33/76,67
Durchschnitt: 23,92/76,08 |
|
1,51
8,32
2,52
3,33
| | Durchschnitt
der Qualität (A, B, C) |
23,325/76,675 |
3,325 |
(D) | Anzahl-Größe-Verhältnis
(im
Vergleich*:
25.10.2006; 03.03.2009; 20.08.2010; 28.08.2011; 31.12.2012;
31.12.2013, 31.12.2014; 31.12.2015; 31.12.2016; 31.12.2017) |
11,89/88,11
(8,56/91,44; 12,30/87,70; 13,25/86,75; 13,80/86,20; 13,14/86,86; 13,16/86,84
13,16/86,84; 13,13/86,87; 21,68/87,32; 11,97/88,03) |
8,11
(11,44; 7,70; 6,75; 6,20; 6,86; 6,84; 6,84; 6,87; 7,32; 8,03) |
(E) | Anzahl
und Größe von der »Größendurchschnittstextdatei«
aus gesehen 
(im
Vergleich*:
25.10.2006; 03.03.2009; 20.08.2010; 28.08.2011;31.12.2012;
31.12.2013, 31.12.2014; 31.12.2015: 31.12.2016; 31.12.2017) |
19,86/80,09
(13,27/86,73;
14,55/85,45; 15,31/84,59; 14,87/85,13; 16,71/83,29; 16,55/83,45; 15,31/84,69;
18.40/81,60; 18,88/81,12; 18,95/81,05)
11,97/87,99
(12,79/87,21;16,56/83,44;
17,04/82,96; 18,14/81,86; 15,93/84,07; 16,14/83,86; 15,27/84,37; 14,41/85,59;
13,67/86,33; 12,93/87,07)
Durchschnitt: 15,92/84,04
(13,03/86,97;
15,555/ 84,445; 16,175/83,825; 16,505/83,495; 16,32/83,68; 16,345/83,655;
15,29//84,71; 16,405/83,595; 16,275/83,725; 15,94/84,06) |
|
von 0,09 bis 0,14
(6,73;
5,45; 4,59; 5,13; 3,29; 3,45; 4,69; 1,60; 1,12; 1,05)
von 7,99 bis 8,03
(7,21; 3,44; 2,96; 1,86;
4,07; 3,86; 4,73; 5,59; 6,33; 7,07)
Durchschnitt: von 4,065 bis 4,47
(6,97;
4,445; 3,825; 3,495; 3,68; 3,655; 3,595; 4,06) |
| | Durchschnitt
der Quantität (D, E)
(im
Vergleich*:
25.10.2006; 03.03.2009; 20.08.2010; 28.08.2011;31.12.2012;
31.12.2013; 31.12.2014; 31.12.2015; 31.12.2016; 31.12.2017) |
14,61/85,39
(11,54/88,46; 14,47/5,53; 15,20/84,80; 15,60/84,40; 15,26/84,74; 15,30/84,70;
15,29/84,71; 15,31/84,69; 15,08/84,92; 14,61/85,39) |
5,39
(8,46;
5,53; 4,80; 4,40: 4,74; 4,70; 5,42; 4,69; 4,92; 5,39) |
(F) | Anzahl
der von außen kommenden Seitenverweise im Verhältnis zur Anzahl
der Textdateien  (im
Vergleich*:
31.12.2013;
31.12.2014; 31.12.2015; 31.12..2016; 31.12.2017) |
22,45/77,65
(22,76/77,24; 24,88/75,12; 18,82/81,18; 20/80; 20,57/79,43)
22,49/77,51
(22,66/77,34; 28,52/71,84; 18,89/81,11; 20,50/80,50; 20,54/79,43)
Durchschnitt: 22,47/77,58
(22,71/77,29; 26,70/73,30; 18,855/81,145; 20,555/79,445) |
|
2,45
(2,76; 4,88; 1,18; 0; 0,57)
2,49
(2,66; 8,52; 1,11; 0,50; 0,54)
| | | Durchschnittt
insgesamt (A bis F)
(im
Vergleich*:
31.12.2013; 31.12.2014; 31.12.2015; 31.12..2016; 31.12.2017) |
~ 22 / ~ 78
(21,31/78,69; 21,79/78,21; 20,75/79,25; 20,87/79,13; 1,50/20,50; 21,40/78,60) |
~ 2
(1,31 bzw. 3,43; 1,79 bzw. 4,73; 0,75 bzw. 3,28; 0,87 bzw. 3,22; 1,40
bzw. 3,97) |
Auch wenn man nur einen Ausschnitt aus den Textdateien als
Stichprobe nimmt, um z.B. festzustellen, was bezüglich der Qualität
( ),
also welcher der beiden Aspekte Bedeutung ( )
und Zugriff ( )
mein Webangebot bestimmt, könnte man zunächst meinen, es sei der
Aspekt der Bedeutung, weil er einfach umfangreicher ist als der Aspekt des
Zugriffs, doch wie wir gesehen haben, kann ja auch der Zugriff - und zwar
auch ganz im Sinne der Pareto-Verteilung (20/80-Regel)
- bedeutender sein, weil er eben den Zugriff auf die Textdateien steuert:
es kommt also auf den Aspekt an. Wenn also z.B. vom Aspekt der Bedeutung
die Rede ist, dann bezieht sich die Bedeutung auf den Text selbst und nicht
z.B. auf den Zugriff des Textes. Man kann den Aspekt Bedeutung jedoch auch
wieder unterteilen, z.B. so, wie ich es auf dieser Seite getan habe:
(1.) rein bzw. streng nach Grad, z.B.
1., 2., 3., 4. Grad ( ),
im Sinne einer Textüberordnung
( ),
hier: G;
(2.) streng nach z.B. 1. Grad und Zitatetexte ( ),
die zwei verschiedenen Textüberordnungen
( )
angehören;
(3.) nach z.B. 1. und 2. Grad und Zitatetexte ( ),
die zwei verschiedenen Textüberordnungen
( )
angehören.
Es kann keinen Zweifel darüber geben, daß die
Textdateien in meinem Webangebot auch zu einem erwähnten Teil aus Zitaten
bestehen ( );
ja, im einzelnen zählen die Zitate-Textdateien ( )
unter den Textdateien sogar zu den größten gemäß Bytes,
Kilobytes oder Megabytes, wie die folgende Tabelle der Textdateien nach
Größe ( )
und insbesondere die bald danach folgende Graphik ( )
bestätigen, aber eben nicht insgesamt bzw. gemäß allen
Aspekten, wie die danach folgende, bereits zum 3. TDK-Exkurs gehörende
Tabelle der 20 und mehr externe Links auf sich ziehenden Textdateien
( )
sowie die ihr folgenden Graphiken (
)
bestätigen werden ( )
und wie es auch schon der 1. TDK-Exkurs gezeigt hat ( )
und das TK-Ergebnis noch zeigen wird ( ).
2.2) Textdateien nach Größe
(Auszug der 100 größten Textdateien) und Kategoriezugehörigkeit
Zwischensummen | |
10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | 100 |  |  |  |  |  |  |  |  |  |  |
Summe
 | Statistik
und Deutung
 | |
Rang |
Name/Titel der
Textdatei |
KB |
Kategorie |
|
|
1 |
Nietzsche
- Aphorismen |
2200 |
Zitate |
|
|
2 |
Ausgewählte
Briefe und E-Briefe |
1800 |
1.
Grad |
|
|
3 |
Spengler:
Der Untergang des Abendlandes |
1783 |
Zitate |
|
|
4 |
Literatur-Verzeichnis
2000 |
1715 |
Rest |
|
|
5 |
Nietzsche
- Aphorismen (Spätphilosophie) |
1353 |
Zitate |
|
|
6 |
Literatur-Verzeichnis
1997-1999 |
1135 |
Rest |
|
|
7 |
Mersch:
Evolution, Zivilisation und Verschwendung |
909 |
Zitate |
|
|
8 |
Weiss
- Zitate |
845 |
Zitate |
|
|
9 |
Lexika-und-Atlanten-Verzeichnis
1997-1999 |
823 |
Rest |
|
|
10 |
Nietzsche:
Der Wille zur Macht |
809 |
Zitate |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
10 größte Textdateien: 13372 KB (10,56%);
Zuwachs: 13372 KB (10,56%);
Zuwachs: 100%. |
Z:
6 (0,25% / 1,71%), 7899 (6,24% / 21,70);
Rest: 3 (0,13% / 0,38%), 3673 (2,90%
/ 55,35%);
G1: 1 (0,04% / 0,59%), 1800 (1,42% /
5,90%). |
11 |
Gästebuch-Einträge
mit Kommentaren (2) |
782 |
2.
Grad |
|
|
12 |
Texte
aus Briefen und E-Briefen - 2012 |
773 |
2.
Grad |
|
|
13 |
Nietzsche
- Aphorismen (Hochphilosophie) |
737 |
Zitate |
|
|
14 |
Luhmann:
Die Gesellschaft der Gesellschaft |
736 |
Zitate |
|
|
15 |
Thoughts
- Demography, Economy, Politics |
734 |
1.
Grad |
|
|
16 |
Texte
aus Briefen und E-Briefen - 2017 |
722 |
2.
Grad |
|
|
17 |
Sprüche
aus dem Globalnetz |
709 |
Zitate |
|
|
18 |
Sloterdijk
- Zitate |
696 |
Zitate |
|
|
19 |
Heinsohn/Steiger
- Zitate |
669 |
Zitate |
|
|
20 |
Bolz
- Zitate (3) |
625 |
Zitate |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
20 größte Textdateien: 20555 KB (16,24%);
Zuwachs: 7183 KB (5,67%);
relativer Zuwachs: 53,72%. |
Z: 12 (0,51%
/ 3,43%), 6 (0,25% / 1,71% / 100%), 11335 (8,95% / 31,14%), 4172 (3,30%
/ 11,46% / 52,82%);
G2: 3 (0,13% / 1,86%), 2277 (1,80%
/ 14,52%);
G1: 2 (0,08% / 1,18%) 1 (0,04% / 100%),
2534 (2,00% / 8,30%), 734 (0,58% / 2,40%);
Rest: keine Veränderung. |
21 |
Fundgrube
WWW (2) |
614 |
Zitate |
|
|
22 |
Nolte:
Historische Existenz |
592 |
Zitate |
|
|
23 |
Evolutionstheorie |
576 |
1.
Grad |
|
|
24 |
Statistik
zur Textsystematik (Anzahl und Größe) |
573 |
Verz. |
|
|
25 |
Statistik
zur Textsystematik (Ø, Ränge, Deutung) |
572 |
Verz. |
|
|
26 |
Spengler:
Postum Veröffentlichtes |
571 |
Zitate |
|
|
27 |
Statistik
zur Textsystematik (Anzahl, Größe, Verweise) |
569 |
Verz. |
|
|
28 |
Statistik
zur Textsystematik (Verweise) |
567 |
Verz. |
|
|
29 |
Sloterdijk
- Aphorismen |
554 |
Zitate |
|
|
30 |
Kommentar
zu Mersch |
543 |
1.
Grad |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
30 größte Textdateien: 26286 KB (20,76%);
Zuwachs: 5731 KB (4,53%);
relativer Zuwachs: 27,88%. |
Z: 16 (0,68%
/ 4,57%), 4 (0,17% / 1,14% / 36,36%), 13766 (10,87% / 40,29), 2331
(1,84% / 6,40% / 20,56);
G1: 4 (0,17% / 1,98%), 2 (0,08% / 1,18%
/ 100%), 2372 (2,05% / 8,96%), 1119 (0,88% / 3,67% / 44,16%);
V: 4 (0,17% / 1,98%), 2281 (1,80% / 10,15%);
G2: keine
Veränderung;
Rest: keine Veränderung. |
31 |
Statistik
zu den Veränderungen m. W. seit April 2001 |
538 |
Verz. |
|
|
32 |
Texte
aus Briefen und E-Briefen - 2014 |
537 |
2.
Grad |
|
|
33 |
Statistik
zur Textsystematik (Ø in % von Anzahl und Größe) |
537 |
Verz. |
|
|
34 |
Engdahl
- Zitate |
537 |
Zitate |
|
|
35 |
Spätdenker |
535 |
1.
Grad |
|
|
36 |
Statistik
zur Textsystematik (Ø abg. und ank. eig.-ext. Verw.) |
532 |
Verz. |
|
|
37 |
Nolte:
Der kausale Nexus |
531 |
Zitate |
|
|
38 |
Statistik
zur Textsyst. (Ø v. Anz., Gr., abg., ank. eig.-ext. Verw.) |
528 |
Verz. |
|
|
39 |
Abend
- Befruchtung |
523 |
1.
Grad |
|
|
40 |
Schopenhauer:
Die Welt als Wille und Vorstellung |
522 |
Zitate |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
40 größte Textdateien: 31606 KB (24,97%);
Zuwachs: 5320 KB (4,20%);
relativer Zuwachs: 20,24%. |
Z: 19 (0,80%
/ 5,43%), 3 (0,13% / 0,85% / 18,75%), 15356 (12,13% / 42,19%), 1590
(1,26% / 4,37% / 11,55%);
V: 8 (0,34% / 3,96%), 4 (0,17% / 1,98%),
4416 (3,49% / 19,65%), 2135 (1,69% / 93,60%);
G1: 6 (0,25% / 3,53%), 2 (0,08% / 1,18%
/ 50%), 3435 (2,71% / 11,25%), 1063 (0,84% / 3,48% / 44,81%);
G2: 4 (0,17% / 2,48%), 1 (0,04% / 0,62%
/ 33,33%), 2814 (2,22% / 10,96%), 537 (0,42% / 2,09% / 23,58%);
Rest: keine Veränderung. |
41 |
Seiten-Verzeichnis
für Suchmaschinen (I) |
521 |
Verz. |
|
|
42 |
Texte
aus Briefen und E-Briefen - 2018 |
511 |
2.
Grad |
|
|
43 |
Abend
- Krise |
510 |
1.
Grad |
|
|
44 |
Fundgrube
WWW (1) |
507 |
Zitate |
|
|
45 |
Spengler:
Jahre der Entscheidung |
506 |
Zitate |
|
|
46 |
Mersch:
Hurra, wir werden Unterschicht! |
502 |
Zitate |
|
|
47 |
Birg
- Zitate |
495 |
Zitate |
|
|
48 |
Gewissenschaft |
494 |
1.
Grad |
|
|
49 |
Licht
+ Licht = Dunkelheit? |
491 |
Zitate |
|
|
50 |
Basis
des 3. TDK-Exkurses zur Statistik der Textdateien |
475 |
Verz. |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
50 größte Textdateien: 36618 KB (28,92%);
Zuwachs: 5012 KB (3,96%);
relativer Zuwachs: 15,86%. |
Z: 24 (1,01%
/ 6,86%), 5 (0,21% / 1,43% / 26,32%), 17857 (14,11% / 49,06%), 2501
(1,98% / 6,35% / 16,29%);
V: 10 (0,42% / 4,95%), 2 (0,08% / 0,99%),
5412 (4,27% / 24,08%), 996 (0,79% / 4,43% / 22,55%);
G1: 8 (0,34% / 4,71%), 2 (0,08% / 1,18%
/ 33,33%), 7263 (5,74% / 23,79%), 1004 (0,79% / 3,29% / 29,23%);
G2: 5 (0,21% / 3,11%), 1 (0,04% / 0,62%
/ 25%), 2814 (2,22% / 10,96%), 511 (0,40% / 1,99% / 18,16%);
Rest: keine Veränderung. |
51 |
Verzeichnis
A. T. a. Z. & Z. 1972 ff. |
471 |
Rest |
|
|
52 |
Statistik
zur Textsyst. (Ränge bzgl. einzelner und aller Abschn.) |
461 |
Verz. |
|
|
53 |
Lebensphilosophie |
459 |
1.
Grad |
|
|
54 |
Abend
- Ehe |
457 |
1.
Grad |
|
|
55 |
Politgeometrie |
454 |
1.
Grad |
|
|
56 |
Jünger
- Aphorismen |
447 |
Zitate |
|
|
57 |
Heinsohn
- Zitate |
446 |
Zitate |
|
|
58 |
TK-Ergebnis
der Statistik der Textdateien |
445 |
Verz. |
|
|
59 |
Huntington:
Kampf der Kulturen |
445 |
Zitate |
|
|
60 |
Texte
aus Briefen und E-Briefen - 2013 |
443 |
2.
Grad |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
60 größte Textdateien: 42146 KB (33,29%);
Zuwachs: 4528 KB (3,58%);
relativer Zuwachs: 12,37%. |
Z:
27 (1,14% / 7,71%), 3 (0,13% / 0,86% / 12,5%), 19195 (15,16% / 52,74%),
1338 (1,06% / 3,68%; 7,49);
V: 12 (0,51% / 5,94%), 2 (0,08% / 0,99%
/ 20%), 6318 (4,99% / 28,11%), 906 (0,72% / 4,03% / 16,74%);
G1: 11 (0,46% / 6,47%), 3 (0,13% / 1,76%
/ 37,5%), 8633 (6,82% / 28,28%), 1370 (1,08% / 4,49% / 18,86%);
G2: 6 (0,25% / 3,73%), 1 (0,04% / 0,62%
/ 20%), 3257 (2,57% / 12,68%), 443 (0,37% / 1,73% / 15,74%);
Rest: 4 (0,17% / 0,50%), 1 (0,04% / 0,13%
/ 33,33%), 4144 (3,27% / 62,45%), 471 (0,37% / 59,09% / 12,95%). |
61 |
Laufende
Kultur |
443 |
1.
Grad |
|
|
62 |
Menschenrechte
als Untergangsbeschleuniger |
437 |
1.
Grad |
|
|
63 |
Globalismus-Terror
(1) |
434 |
1.
Grad |
|
|
64 |
Kaufmann
- Zitate |
432 |
Zitate |
|
|
65 |
Wochenschau |
430 |
1.
Grad |
|
|
66 |
Tagesschau |
429 |
1.
Grad |
|
|
67 |
Scholl-Latour
- Zitate |
425 |
Zitate |
|
|
68 |
3.
TDK-Exkurs zur Statistik der Textdateien |
425 |
Verz. |
|
|
69 |
Ranking |
424 |
1.
Grad |
|
|
70 |
Graphiken-&-Tabellen-Verzeichnis
- Kultur (3) |
424 |
Verz. |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
70 größte Textdateien: 46449 KB (36,69%);
Zuwachs: 4303 KB (3,40%);
relativer Zuwachs: 10,21%. |
Z:
29 (1,23% / 8,29%), 2 (0,08% / 0,57% / 7,41%), 20052 (15,84% / 55,09%),
857 (0,68% / 2,18% / 4,46%);
G1: 17 (0,72% / 10%), 6 (0,25% / 3,53%
/ 54,55%), 10997 (8,69% / 36,02%), 2173 (1,72% / 7,12% / 25,17%);
V: 14 (0,59% / 6,93%), 2 (0,08% / 0,99%
/ 16,67%), 7167 (5,66% / 31,89%), 849 (0,67% / 3,78% / 13,44%);
G2: keine Veränderung;
Rest: keine Veränderung. |
71 |
Personen-Verzeichnis
S |
418 |
Verz. |
|
|
72 |
Aphorismen
zu Individualismus und Feminismus |
416 |
1.
Grad |
|
|
73 |
Mersch:
Irrweg Gleichheitsfeminismus |
414 |
Zitate |
|
|
74 |
Bolz
- Zitate (2) |
408 |
Zitate |
|
|
75 |
Nolte:
Die Weimarer Republik |
407 |
Zitate |
|
|
76 |
Prämoderne,
Moderne, Postmoderne |
396 |
1.
Grad |
|
|
77 |
Graphiken-&-Tabellen-Verzeichnis
- Kultur (2) |
394 |
Verz. |
|
|
78 |
Andersheilende
(Päpste) |
393 |
1.
Grad |
|
|
79 |
Glaube |
389 |
1.
Grad |
|
|
80 |
Analogien
- Moderne |
386 |
1.
Grad |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
80 größte Textdateien: 50470 KB (39,87%);
Zuwachs: 4021 KB (3,18%);
relativer Zuwachs: 8,66%. |
Z: 32 (1,35%
/ 9,14%), 3 (0,13% / 0,86% / 10,34%), 21281 (16,81% / 58,47%), 1229
(0,97% / 3,38% / 6,13%);
G1: 22 (0,93% / 12,94%), 5 (0,21% / 2,94%
/ 29,41%), 12977 (10,25% / 42,51%), 1980 (1,56% / 6,49% / 18,00%);
V: 16 (0,68% / 7,92%), 2 (0,08% / 0,99%
/ 21,43%), 7979 (6,30% / 35,51%), 812 (0,64% / 3,61% / 11,33%);
G2: keine Veränderung;
Rest: keine Veränderung |
81 |
Nolte:
Der europäische Bürgerkrieg |
380 |
Zitate |
|
|
82 |
Kommentare
zu Kommentaren im WWW (104) |
378 |
2.
Grad |
|
|
83 |
Kommentare
zu Kommentaren im WWW (89) |
374 |
2.
Grad |
|
|
84 |
Hochdenker |
368 |
1.
Grad |
|
|
85 |
Logik
und Erkenntnis |
368 |
1.
Grad |
|
|
86 |
Leipert
(Hrsg.): Demographie und Wandel |
357 |
Zitate |
|
|
87 |
Chronik |
356 |
1.
Grad |
|
|
88 |
Seiten-Verzeichnis
(in Übersicht) |
352 |
Verz. |
|
|
89 |
Benoist
- Zitate |
349 |
Zitate |
|
|
90 |
Deutung
der statistischen Ergebnisse für die Textsystematik |
348 |
Verz. |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
90 größte Textdateien: 54100 KB (42,73%);
Zuwachs: 3630 KB (2,87%);
relativer Zuwachs: 7,64%. |
Z: 35 (1,48%
/ 10%), 3 (0,13% / 0,86% / 9,38%), 22367 (17,67% / 61,45%), 1086 (0,86%
/ 2,98% / 5,10%);
G1: 25 (1,06% / 14,71%), 3 (0,13% / 1,76%
/ 13,64%), 14069 (11,11% / 46,09%), 1092 (0,86% / 3,58% / 8,41%);
V: 18 (0,76% / 8,91%), 2 (0,08% / 0,99%
/ 12,5%), 8679 (6,86% / 38,62%), 700 (0,55% / 3,11% / 8.77%);
G2: 8 (0,25% / 4,97%), 2 (0,08% / 1,24%
/ 33,33%), 4009 (3,17% / 15,61%), 443 (0,35% / 1,73% / 23,08%););
Rest: keine Veränderung. |
91 |
Erdgeschichte |
343 |
1.
Grad |
|
|
92 |
Acht Historienkulturen |
343 |
1.
Grad |
|
|
93 |
Wohnen |
338 |
1.
Grad |
|
|
94 |
Nachmittag
- Wissensschulung |
338 |
1.
Grad |
|
|
95 |
1.
TDK-Exkurs zur Statistik der Textdateien |
337 |
Verz. |
|
|
96 |
Graphiken-&-Tabellen-Verzeichnis
- Kultur (1) |
336 |
Verz. |
|
|
97 |
Reichholf
- Zitate |
335 |
Zitate |
|
|
98 |
Mersch:
Die Familienmanagerin |
334 |
Zitate |
|
|
99 |
Estulin
- Zitate |
333 |
Zitate |
|
|
100 |
Personen-Verzeichnis |
333 |
Verz. |
|
|
![Zum Beginn der Tabelle (Textdateien nach Größe [Auszug]) Tabelle](bilder/bunte_kometen_kugelverlauf_03.jpg) |
100 größte Textdateien: 57470 KB (45,39%);
Zuwachs: 3370 KB (2,66%);
relativer Zuwachs: 6,23%. |
Z:
38 (1,62% / 11,11%), 1 (0,04% / 0,29% / 2,70%), 22751 (23,96% / 70,13%),
307 (0,27% / 0,91% / 1,39%);
G1: 29 (1,29% / 19,48%), 4 (0,17% / 2,60%
/ 15,38%), 14949 (14,82% /66,86%), 1247 (1,08% / 4,71% / 8,96%);
V: 21 (0,39% / 4,86%), 3 (0,13% / 1,62%
/ 50%), 2832 (2,45% / 19,91%), 921 (0,80% / 6,47% / 48,19%);
G2: keine Veränderung;
Rest: keine Veränderung. |
2.3) Anzahl, Größe
und Anzahl-Größe-Verhältnis der Textdateien und ihrer Kategorien
(2.3.1) Seiten-Anzahl der Textdateien-Kategorien
 |
|
1) Rest:
797 (33,69%) |
|
2) Zitate:
350 (14,79%) |
|
3) Navigatoren:
339 (14,33%) |
|
4) Verzeichnisse:
202 (8,54%)) |
|
5) 4.
Grad: 176 (7,44%) |
|
6) 3.
Grad: 171 (7,23%) |
|
7) 1.
Grad: 170 (7,19%) |
|
8) 2.
Grad: 161 (6,80%) |
|
Durchschnittstextkategorie:
2366 / 8
= 295,75 (12,50%)!  |
(2.3.2) KB-Größe der Textdateien-Kategorien
 |
|
1) Zitate:
36397 (28,75%) |
|
2) 1.
Grad: 30528 (24,11%) |
|
3) 2.
Grad: 25677 (20,28%) |
|
4) Verzeichnisse:
22472 (17,75%) |
|
5) Rest:
6636 (5,24%) |
|
6) Navigatoren:
2503 (1,98%) |
|
7) 3.
Grad: 1775 (1,40%) |
|
8) 4.
Grad: 608 (0,48%) |
|
Durchschnittstextkategorie:
126600 / 8
= 15825 (12,50%)!  |
(2.3.3) Größe/Anzahl-Quotient der
Textdateien-Kategorien (KB-Größe pro Textdatei)  |
|
1) 1.
Grad: 179,58 |
|
2) 2.
Grad: 159,48 |
|
3) Verzeichnisse:
111,25 |
|
4) Zitate:
103,99 |
|
5) 3.
Grad: 10,38 |
|
6) Rest:
8,33 |
|
7) Navigatoren:
7,38 |
|
8) 4.
Grad: 3,45 |
|
Ø--G/A-Q:
126600 / 2366 = 53,51 ( )
- errechent
sich wie die Größendurchschnittstextdatei
( ) ! |
Bedeutender als die schiere Anzahl ( )
und die schiere Größe ( )
ist das Verhältnis der beiden, z.B. ausgedrückt im Größe/Anzahl-Quotienten
( ).
Man täusche sich also nicht darüber, daß die Zitate-Textdateien
( )
die größte Kategorie (abgesehen davon, daß der Rest
[ ]
statistisch auch als Kategorie gilt) bilden ( )
und im einzelnen relativ große Textdateien sind, denn der Grund
dafür liegt einfach darin, daß nicht selten fast ganze Bücher
darin zitiert sind. Die Zitate-Textdateien stellen also insgesamt einen
relativ - d.h.: bezogen auf die Normalverteilung der insgesamt 8
Kategorien ( )
- nicht unbedeutenden Teil in meinem Webangebot dar ( ).
6 der 10 größten Textdateien (vgl. Ränge 1 bis 10 )
sind Zitate-Textdateien, also sind nur 4 der größten 10 Textdateien
Nichtzitate-Textdateien ( ).
Bei der Marke-der-größten-40-Textdateien ist mit 21 die
Anzahl der Nichtzitate-Textdateien bereits größer als die der
Zitate-Textdateien: 19 ( ).
Unter den größten 100 Textdateien befinden sich bereits 62 Nichtzitate-Textdateien
und - nur noch (!) - 38 Zitate-Textdateien ( )
Für die Zitate-Textdateien bedeutet der Weg vom Verhältnis
6:4 unter den größten 10 Textdateien zum Verhältnis 38:62
unter den größten 100 Textadeteien einen 40%-Verlust, nämlich
einen Rutsch um 22 Prozentpunkte von 60% ( )
auf 38% ( ),
und an der Marke-der-größten-40-Textdateien ( )
den Verlust der absoluten Mehrheit.
Bezüglich der Qualität ( )
- der Aspekte Bedeutung ( )
und Zugriff ( )
- spielt ja die Größe ohenhin keine große
Rolle. Nur im Zusammenhang mit den anderen Textdateien, vor allem
mit denen der Grade 1 ( )
und 2 ( )
sind die Zitate-Textdateien von echter Bedeutung, nämlich bezüglich
des Bedeutungsaspekts ( ),
wie z.B. Tabelle 2.1.15 ( )
und Tabelle 2.1.16 ( )
verdeutlichen.
Die unter den nach Größe geordneten Textdateien
erste Nichtzitate-Textdatei (Ausgewählte
Briefe und E-Briefe )
gehört zur Kategorie 1. Grad ( );
die unter den nach Größe geordneten Textdateien zweite Nichtzitate-Textdateie
(Verzeichnis
2000 )
gehört zur Kategorie Rest ( )
und stammt noch sogar komplett aus der vorgeburtlichen Zeit
meines Webangebots ( ).
Wir können also feststellen, daß die Zitate-Textdateien zwar
im einzelnen sehr groß sind, aber insgesamt und besonders auch in
bezug auf den Bedeutungsaspekt ( )
eine nur mitllere Stellung einnehmen.
Allein schon der 710 Ränge
(30,01% von 2366 Rängen) ausmachende Abstand zwischen der Größendurchschnittstextdatei
(Rang 473 [19,99% von 2366 Rängen]) und der Textdatei
des mittleren Rangs nach Größe (zwischen den Rängem
1183 [50%] zeigt deutlich, daß die bei weitem meisten Textdateien
kleine Textdateien sind, denn ansonsten lägen die Ränge
der beiden Durchschnittstextdateien z.B. viel näher beieinander
(bei relativ gleicher Verteilung) oder z.B. sogar gleich nah
beieinander (bei gleicher Verteilung) oder z.B. im Bereich der
größeren Textdateien (bei vielen großen Textdateien).
Dies deutet eben auch darauf hin, daß meine Untersuchung der Frage,
ob und, wenn ja, wie sehr die Pareto-Verteilung (20/80-Regel)
auf mein Webangebot zutrifft, nicht umsonst war. Ein Webangebot zeichnet
sich vorzugsweise durch Qualität aus, und diese Qualität
hat selbstredend auch eine quantitative Seite, genauso wie ein durch
Quantität ausgezeichnetes Webangebot selbstredend auch eine qualitative
Seite hat, allerdings eine ziemlich öde oder zu sehr protzende, denn
gleichverteilte Textdateien verraten z.B. den gekauften Politiker,
seinen Wähler und den Medioten und zu viele große Textdateien
z.B. den Verkäufer, den Sammler und den Angeber. Ein sehr ungleich
verteilte Textdateien und bestimmte Richtungen bevorzugendes Webangebot
hat tendenziell sehr wenige große, wenige bis viele mittlere und
sehr viele kleine Textdateien - ungefähr entsprechend der 20/80-Regel
( Pareto-Verteilung), wobei es nicht unbedingt entscheidend
ist, ob die 20 oder 80 große, mittlere oder kleine
Textdateien sind, weil es auch auf die Aspekte ankommt.       
20% der Größe meines Webangebots betragen derzeit
( )
rd. 25,33 MB. Diese Größe ist mit den größten 28-29
Textdateien erreicht ( ).
Die Größe der 20 größten Textdateien beträgt
derzeit 20,64 MB (16,30%), die der 30 größten
Textdateien 26,37 MB (18,88%). Die größten 28 bis 29 Textdateien
sind also derzeit für die 20% der Gesamtgröße nötig.
Aber ob das als ein sicheres Indiz dafür gelten kann, daß sie
die restlichen 80% der Gesamtgröße mitrepräsentieren, kann
man durchaus bezweifeln, wie der folgende Exkurs zeigen wird ( ).
Doch zunächst folgen die Platzbelegungen in diesem Exkurs:

Letzte Aktualisierung: 31.12.2018.
|