Jupyter notebook vorlesung-master/Notebooks/CHVorl2.ipynb
Vorlesung 2: Gruppen von Individuen
Data mit Pandas Dataframes
Python Einführung: http://www.diveintopython.net/toc/index.html
Reguläre Ausdrücke: http://www.regexe.de/hilfe.jsp https://pymotw.com/2/re
Pandas: http://www.data-analysis-in-python.org/3_pandas.html : https://bitbucket.org/hrojas/learn-pandas
Pandas Dataframes
0 | |
---|---|
10. Akrai | (Akraios) Map 47. Lat. 37.05,long. 14.55. ... |
11. Alaisa | (Alaisinos) Map 47. Lat. 38.00,long. 14.15.... |
12. Alontion | (Alontinos) Map 47. Lat. 38.05,long. 14.40.... |
13. Apollonia | (Apolloniates) Map 47. Lat. 38.00,long. 14.3... |
Beschreibung | |
---|---|
10. Akrai | (Akraios) Map 47. Lat. 37.05,long. 14.55. ... |
11. Alaisa | (Alaisinos) Map 47. Lat. 38.00,long. 14.15.... |
12. Alontion | (Alontinos) Map 47. Lat. 38.05,long. 14.40.... |
13. Apollonia | (Apolloniates) Map 47. Lat. 38.00,long. 14.3... |
14. Engyon | (Engyinos) Map 47. Lat. 37.45,long. 14.35.... |
Konstruktion neuer Merkmale
Textmuster mit regulären Ausdrücken
http://www.regexe.de/hilfe.jsp https://www.cheatography.com/davechild/cheat-sheets/regular-expressions/
http://www.coli.uni-saarland.de/courses/python1-10/folien/PythonI10-07.pdf
Beschreibung | city | city_index | |
---|---|---|---|
5. Abakainon | (Abakaininos) Map 47. Lat. 38.05,long. 15.05... | bakainon | 5 |
6. Adranon | (Adranites) Map 47. Lat. 37.40,long. 14.50.... | dranon | 6 |
7. Agyrion | (Agyrinaios) Map 47. Lat. 37.40,long. 14.30... | gyrion | 7 |
8. Aitna | (Aitnaios) Map 47.Location of Aitna I as ... | itna | 8 |
Textmustersuche in der Beschreibung einer Polis
Neue Funktionen
Geographische Koordinaten
Beschreibung | city | city_index | Latitude | Longitude | |
---|---|---|---|---|---|
5. Abakainon | (Abakaininos) Map 47. Lat. 38.05,long. 15.05... | bakainon | 5 | 38.05 | 15.05 |
6. Adranon | (Adranites) Map 47. Lat. 37.40,long. 14.50.... | dranon | 6 | 37.40 | 14.50 |
7. Agyrion | (Agyrinaios) Map 47. Lat. 37.40,long. 14.30... | gyrion | 7 | 37.40 | 14.30 |
8. Aitna | (Aitnaios) Map 47.Location of Aitna I as ... | itna | 8 | NaN | NaN |
9. Akragas | (Akragantinos) Map 47. Lat. 37.20,long. 13.... | kragas | 9 | 37.20 | 13.35 |
10. Akrai | (Akraios) Map 47. Lat. 37.05,long. 14.55. ... | Akrai | 10 | 37.05 | 14.55 |
11. Alaisa | (Alaisinos) Map 47. Lat. 38.00,long. 14.15.... | Alaisa | 11 | 38.00 | 14.15 |
12. Alontion | (Alontinos) Map 47. Lat. 38.05,long. 14.40.... | Alontion | 12 | 38.05 | 14.40 |
13. Apollonia | (Apolloniates) Map 47. Lat. 38.00,long. 14.3... | Apollonia | 13 | 38.00 | 14.35 |
14. Engyon | (Engyinos) Map 47. Lat. 37.45,long. 14.35.... | Engyon | 14 | 37.45 | 14.35 |
15. Euboia | (Euboeus) Map 47. Unlocated. Type: C: .Th... | Euboia | 15 | NaN | NaN |
16. Galeria | (Galarinos) Map 47.Unlocated (Manni ( 1981)... | Galeria | 16 | NaN | NaN |
17. Gela | (Geloios, Geloaios) Map 47. Lat. 37.05,long... | Gela | 17 | 37.05 | 14.15 |
18. Heloron | (Ailoros) Map 47. Lat. 36.50,long. 15.05. ... | Heloron | 18 | 36.50 | 15.05 |
19. Henna | (Hennaios) Map 47. Lat. 37.35,long. 14.15. ... | Henna | 19 | 37.35 | 14.15 |
20. Herakleia 1 | (Herakleotes) Map 47. Lat. 37.25,long. 13.15... | Herakleia 1 | 20 | 37.25 | 13.15 |
21. Herakleia 2 | Map 47.Unlocated site in western Sicily, i... | Herakleia 2 | 21 | NaN | NaN |
22. Herbes(s)os | (Herbessinos) Map 47. Unlocated, but presum... | Herbes(s)os | 22 | NaN | NaN |
23. Herbita | (Herbitaios) Map 47.Unlocated (cf. C. Boeh... | Herbita | 23 | NaN | NaN |
24. Himera | (Himeraios) Map 47. Lat. 37.55,long. 13.50.... | Himera | 24 | 37.55 | 13.50 |
25. Hippana | (Hipanatas) Map 47. Lat. 37.40,long. 13.25... | Hippana | 25 | 37.40 | 13.25 |
26 *Imachara | (Imacharaios) Map 47. Unlocated. Barr. tent... | Imachara | 26 | NaN | 14.20 |
27. Kallipolis | (Kallipolites) Map 47. Unlocated. Type: A... | Kallipolis | 27 | NaN | NaN |
28. Kamarina | (Kamarinaios) Map 47. Lat. 36.50,long. 14.25... | Kamarina | 28 | 36.50 | 14.25 |
29. Kasmenai | (Kasmenaios) Map 47. Lat. 37.05,long. 14.50.... | Kasmenai | 29 | 37.05 | 14.50 |
30. Katane | (Katanaios) Map 47. Lat. 37.30,long. 15.05.... | Katane | 30 | 37.30 | 15.05 |
31. Kentoripa | (Kentoripinos) Map 47. Lat. 37.35,long. 14.4... | Kentoripa | 31 | 37.35 | 14.45 |
32. Kephaloidion | (Kephaloiditas) Map 47. Lat. 38.00, long. 14... | Kephaloidion | 32 | 38.00 | 14.00 |
33. Leontinoi | (Leontinos) Map 47. Lat. 37.15,long. 15.00.... | Leontinoi | 33 | 37.15 | 15.00 |
34. Lipara | (Liparaios) Map 47. Lat. 38.30 long. 14.55.... | Lipara | 34 | 38.30 | 14.55 |
35. *Longane | (Longenaios) Map 47. Lat. 38.05,long. 15.10.... | *Longane | 35 | 38.05 | 15.10 |
36. Megara | (Megareus) Map 47. Lat. 37.10,long. 15.10. ... | Megara | 36 | 37.10 | 15.10 |
37. Morgantina | (Morgantinos) Map 47. Lat. 37.25,long. 14.30... | Morgantina | 37 | 37.25 | 14.30 |
38. Mylai | (Mylaios) Map 47. Lat. 38.15, long 15.15. ... | Mylai | 38 | 38.15 | NaN |
39. Mytistratos | (Mytiseratinos) Map 47. Lat. 37.35,long. 14.... | Mytistratos | 39 | 37.35 | 14.00 |
40. Nakone | (Nakonaios) Map 47. Unlocated (Tegon ( 199... | Nakone | 40 | NaN | NaN |
41. Naxos | (Naxios) Map 47. Lat. 37.50,long. 15.15. S... | Naxos | 41 | 37.50 | 15.15 |
42. Petra | (Petrinos) Map 47. Unlocated (cf. Bejor (... | Petra | 42 | NaN | NaN |
43. Piakos | (Piakinos) Map 47. Unlocated, but possibly... | Piakos | 43 | NaN | NaN |
44. Selinous | (Selinousios) Map 47. Lat. 37.35,long. 12.5... | Selinous | 44 | 37.35 | 12.50 |
45. (Sileraioi) | Map 47. Unlocated (cf. Manni ( 1981) 225)... | (Sileraioi) | 45 | NaN | NaN |
46. (Stielanaioi) | Map 47. Lat. 37.10,long. 14.55: the loca- ... | (Stielanaioi) | 46 | 37.10 | 14.55 |
47. Syrakousai | (Syrakosios) Map 47. Lat. 37.05,long. 15.15.... | Syrakousai | 47 | 37.05 | 15.15 |
48. Tauromenion | (Tauromenitas) Map 47. Lat. 37.50, long. 15.... | Tauromenion | 48 | 37.50 | 15.15 |
49. Tyndaris | (Tyndarites) Map 47. Lat. 38.10,long. 15.05... | Tyndaris | 49 | 38.10 | 15.05 |
50. (Tyrrhenoi) | Map 47. Unlocated. Type: C: .The Tyr- rhen... | (Tyrrhenoi) | 50 | NaN | NaN |
51. Zankle | (Zanklaios)/Messana | Zankle | 51 | NaN | NaN |
Zitatnachweise, Namen, Jahreszahlen
Muster (Pattern) zur Erkennung der Literaturreferenzen
Primärquellen
(Polyb. 1.18.2) (Diod. 13.85.4 (r 406)) (Diod. 13.108.2) (Hdt. 7.165; IGDS no. 182a) (Pind. Pyth. 6) (Thuc. 6.4.4: µµ ) (Xanthos (FGrHist 765) fr. 33; Arist. fr. 865)
Sekundärquellen
(Karlsson ( 1995) 161 (Waele ( 1971) 195; Hinz ( 1998) 79)
Jahreszahlen ( dddd)
Testen der regulären Ausdrücke
Finde alle groß-geschriebenen Wörter mit mindestens 3 nachfolgenden kleinen Buchstaben.
Finde alle Ausdrücke wie oben, denen ein Punkt folgt, mit anschließenden Zifferfolgen der Form [Ziffern][Punkt][Ziffern][Punkt][Ziffern]
Finde alle Ausdrücke wie oben, wobei statt des Punktes nach den kleinen Buchstaben auch zwei Leerzeichen und eine runde Klammer folgen können
Beschreibung | city | city_index | Latitude | Longitude | Namen | Quellen | |
---|---|---|---|---|---|---|---|
5. Abakainon | (Abakaininos) Map 47. Lat. 38.05,long. 15.05... | bakainon | 5 | 38.05 | 15.05 | [Abakaininos, Size, Type, Diod, Diod, Steph, D... | [Diod. 14.90.3, Diod. 19.65.6, Diod. 14.78.5, ... |
6. Adranon | (Adranites) Map 47. Lat. 37.40,long. 14.50.... | dranon | 6 | 37.40 | 14.50 | [Adranites, Size, Type, Diod, Steph, Diod, Adr... | [Diod. 14.37.5, Diod. 16.68.9, Diod. 14.37.5, ... |
7. Agyrion | (Agyrinaios) Map 47. Lat. 37.40,long. 14.30... | gyrion | 7 | 37.40 | 14.30 | [Agyrinaios, Size, Type, Diod, Ptol, Geog, Ste... | [Byz. 23.19), Diod. 16.82.4, Moggi ( 1976), D... |
8. Aitna | (Aitnaios) Map 47.Location of Aitna I as ... | itna | 8 | NaN | NaN | [Aitnaios, Location, Aitna, Katane, Aitna, Dio... | [Diod. 11.49.1, Diod. 11.49.1, Diod. 11.66.4, ... |
Muster zur Erkennung von Namen
Empedokles ( 496) Theron ( 476) Timoleon c. 338
Datenvalidierung
Wertverteilungen, Test auf Dopplungen
Lese Werte der Spalte Quellen als Liste aus.
Reduziere Unterlisten auf eine Gesamtliste.
Zähle die Häufigkeit der verschiedenen Quellen und speichere als Dictionary.
Erzeuge DataFrame, mit neuem Index und Namen der Spalten. Sortiere diesen Nach der Häufigkeit der Quelle.
Quelle | Häufigkeit | |
---|---|---|
382 | Manganaro ( 1996 | 15 |
331 | Hinz ( 1998) | 13 |
509 | Talbert ( 1974) | 13 |
83 | Cavalier ( 1991) | 11 |
344 | Karlsson ( 1995) | 9 |
226 | Diod. 14.78.7 | 9 |
113 | Diod. 11.49.2 | 9 |
47 | Boehringer ( 1998) | 8 |
478 | Rutter ( 1997) | 8 |
327 | Hansen ( 2000) | 8 |
Visualisierungen
Zeige die Verteilung der Häufigkeiten als Histogram. Um auch Häufigkeiten zu erkennen, die nicht so oft auftreten, kann man in die Darstellung zoomen. Das Haus-Symbol zeigt wieder den ursprünglichen Zustand der Figur.
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
<ipython-input-44-9eae33d69195> in <module>()
----> 1 import folium
2 from folium import plugins
3 from folium.map import *
ImportError: No module named 'folium'
Remove all entries where no latitude or longitude is given.