Falls man mal einen Wikipedia-Artikel im Text-Format benötigt (bspw. um ein neuronales Netz zu testen oder zu trainieren), kann diesen im JSon-Format exportieren. Dazu einfach einen Link im Browser mit diesen GET-Query-String eingeben:

https://de.wikipedia.org/w/api.php?action=query&format=json&titles=Berlin&prop=extracts&exintro&explaintext

 

Ausgabe:

{
    "batchcomplete": "",
    "query": {
        "pages": {
            "2552494": {
                "pageid": 2552494,
                "ns": 0,
                "title": "Berlin",
                "extract": "Berlin [b\u025br'li:n] ist die Hauptstadt und ein Land der Bundesrepublik Deutschland. Die Gro\u00dfstadt ist mit rund 3,8 Millionen Einwohnern die ...."
            }
        }
    }
}