Difference between revisions of "ConfIDent Migrationplan"
(11 intermediate revisions by the same user not shown) | |||
Line 132: | Line 132: | ||
OPENRESEARCH - ConfIDent | OPENRESEARCH - ConfIDent | ||
# Provenance Data Pflicht | # Provenance Data Pflicht | ||
+ | |||
+ | = Integration = | ||
+ | orcurate acts as a purgatorium | ||
+ | http://diagrams.bitplan.com/render/png/0x17e65a1b.png | ||
+ | source at http://diagrams.bitplan.com/render/txt/0x17e65a1b.txt | ||
+ | <graphviz> | ||
+ | digraph purgatorium { | ||
+ | or [ label="OPENRESEARCH" ] | ||
+ | lts [ label="OPENRESEARCH LTS"] | ||
+ | or -> ori5 [ label="cleanup pipeline" ] | ||
+ | orcurate -> lts | ||
+ | or -> orps [ label="wikipush content" ] | ||
+ | orps -> or [ label="iteration1 properties" ] | ||
+ | or -> ormk [ label="wikipush content" ] | ||
+ | or -> orth [ label="wikipush content" ] | ||
+ | orth -> orintegrate [ label="integrate templates and forms"] | ||
+ | ormk -> orintegrate [ label="integrate templates and forms"] | ||
+ | orps -> orintegrate [label="iteration1 properties" ] | ||
+ | or -> orintegrate [ label="wikipush content" ] | ||
+ | or -> orbitplan [ label="wikipush content" ] | ||
+ | orbitplan -> orth [ label="SiDIF templates" ] | ||
+ | orintegrate -> ori5 [ label="wikipush content" ] | ||
+ | or ->cr [ label="wikipush content" ] | ||
+ | ori5 -> orcurate [ label="wikipush content" ] | ||
+ | cr -> orintegrate [ label="templates for Country,Region,City" ] | ||
+ | or -> lts [ label="SQL SPAM cleanup, user cleanup, data cleanup" ] | ||
+ | } | ||
+ | </graphviz> | ||
= OPENSOURCE = | = OPENSOURCE = | ||
Line 158: | Line 186: | ||
# query | # query | ||
# macro limit | # macro limit | ||
− | # PHP | + | # PHP limits and debugging issues see http://wiki.bitplan.com/index.php/PHP_Mediawiki_Eclipse_debugging |
+ | |||
+ | There are no proper "Functions" at this point only PHP extensions and MediaWiki Macros. | ||
+ | For future needs like ... import / export ... and other fucntionalities and external function system via API is needed | ||
+ | == Bots == | ||
+ | Standard MediaWiki bot frameworks like | ||
+ | # MWClient | ||
+ | # pywikibot | ||
+ | have been extended with py-3rdparty-mediawiki see wikipush- Toolkit | ||
+ | |||
+ | == Way out == | ||
+ | ... do not push limits ... nach uns die Sinnflut ... | ||
+ | = Graph Approaches = | ||
+ | == SiGNaL == | ||
+ | * http://wiki.bitplan.com/index.php/Category:SiGNaL | ||
+ | |||
+ | == GraphQL == | ||
+ | * http://wiki.bitplan.com/index.php/GraphQL | ||
+ | * http://dbis.rwth-aachen.de/cms/publications/conferencearticle.2020-10-01.2582110587/at_download/pdfFile | ||
+ | * https://github.com/graphql-python/flask-graphql | ||
+ | * https://github.com/graphql-python/graphene | ||
+ | * https://www.apollographql.com/docs/federation/ | ||
+ | * https://platform.ontotext.com/soml/intro.html | ||
+ | * https://knowgraphs.eu/ws2021/ | ||
+ | * https://www.ontotext.com/knowledge-hub/research-projects/ | ||
− | + | == Gremlin == | |
− | + | * http://wiki.bitplan.com/index.php/Gremlin | |
= Meetings = | = Meetings = |
Latest revision as of 10:49, 23 March 2021
Motivation
OPENRESEARCH LTS ist erforderlich, da die Menge an Detailproblemen für den Betrieb des aktuellen OPENRESEARCH:
und insbesondere die zugehörigen "Showstopper" https://github.com/SmartDataAnalytics/OpenResearch/labels/showstopper einem wirtschaftlichen Weiterbetrieb entgegenstehen. Ohne einen "Befreiungsschlag" wird die Not nicht gelindert.
OPENRESEARCH LTS
(Purgatorium? ) OPENRESEARCH LTS wird eine Version von Openresearch ohne manuelle Kuratierungsmöglichkeit durch unqualifizierte Externe sein. Ausgesperrt werden:
- SPAMMER
- Verwender von defekten Tools wie z.B. CSV Import
- Gelegenheits-User die den aktuellen Stand der agilen Entwicklung nicht mitverfolgen können (Ständiges Update des "Manual" ist nicht möglich, wenn hohes Tempo in der Entwicklung erfolgt ...)
Die Qualifikationsvoraussetzungen sind zu definieren - z.B. Mindestens Teilnahme am 1/2 Tag SMW Basics und 1/2 Tag Kuratierung in OPENRESEARCH.
D.h. zur Zeit erfüllen diese Voraussetzungen einige Kuratoren und Mitglieder des ConfIDent Teams. Sogar einige ehemalie OPENRESEARCH Projektteilnehmer wie Sahar Vahdati und Said Fathalla erfüllen die Voraussetzung zur Zeit nicht.
Bisher ist ein Termin für die Einarbeitung/Schulung nicht zu Stande gekommen. Es sind weitere Angebote geplant - die Wirkung hängt davon ab wie diese Angebote angenommen werden.
OPENRESEARCH LTS ist ein Migrationsvehikel zwischen dem aktuellen OPENRESEARCH und dem zukünftigen ConfIDent.
Es ermöglicht einen produktiven Datenserver als Backend der mit unterschiedlichsten Frontends bedient werden kann.
Beispielsweise könnte das OPENRESEARCH Calender Tool als Frontend eingebunden werden.
Die Frontends und zugehörigen APIs sind noch zu schaffen.
Eine weitere Möglichkeit dazu ist z.B. der WikiCMS ansatz der es ermöglicht bootstrap4/python wie in http://fb4demo.bitplan.com/ zu verwenden zu nutzen.
Eine andere Möglichkeit besteht darin unterschiedliche OPENRESEARCH Kopien mit einander zu synchronisieren (wie früher Lotus Notes). Als erster Schritt kann z.B. in einer der OPENRESEARCH Kopien mit Kuratoren getestet werden wie der Arbeitsablauf für Kuratoren optimiert werden kann. Damit die manuellen Ergebnisse dieser Test-Phase produktiv genutzt werden können wird einfach das wikipush - Toolkit verwendert.
So ist z.B.
wikibackup -q [[Modification date::>yesterday]]
geeignet um das WikiSON Markup der Ergebnisse zu erzeugen. Mit einfachen unix-Tools wie awk kann dieses Markup OPENRESEARCH LTS kompatibel gemacht werden und dann mit WikiRestore in das LTS System synchronisiert werden.
Pain Assessment
Feature Matrix
Versions
Triples / Queries
Triple access e.g. via the https://www.semantic-mediawiki.org/wiki/Architecture_Tradeoffs work-around should be possible. Better Queries should be possible using SQL/SPARQL
Nightly Backup Sync
- Curator
- Kompatible
- Bridge - Problem
- Master System ... OPENRESEARCH LTS - Entitäten
OPENRESEARCH - ConfIDent
- Provenance Data Pflicht
Integration
orcurate acts as a purgatorium
source at http://diagrams.bitplan.com/render/txt/0x17e65a1b.txt

OPENSOURCE
Ist den Openresearch Open Source? Wikipush ... Get your own copy of Research ...
- Forschungswikis
Trigger
- WikiCFP
- Openresearch Calendar Trigger
- Generator - WP3 / WP1
Quality Gate
- Purgatorium
- Automatic Metrics
- Manual Metrics
- https://wiki.tib.eu/confluence/pages/viewpage.action?pageId=112070529
Issues
Migrationsplan ...
After Repair
- Regular Expression
- length
- nightly script for check
SMW limits
- query
- macro limit
- PHP limits and debugging issues see http://wiki.bitplan.com/index.php/PHP_Mediawiki_Eclipse_debugging
There are no proper "Functions" at this point only PHP extensions and MediaWiki Macros. For future needs like ... import / export ... and other fucntionalities and external function system via API is needed
Bots
Standard MediaWiki bot frameworks like
- MWClient
- pywikibot
have been extended with py-3rdparty-mediawiki see wikipush- Toolkit
Way out
... do not push limits ... nach uns die Sinnflut ...
Graph Approaches
SiGNaL
GraphQL
- http://wiki.bitplan.com/index.php/GraphQL
- http://dbis.rwth-aachen.de/cms/publications/conferencearticle.2020-10-01.2582110587/at_download/pdfFile
- https://github.com/graphql-python/flask-graphql
- https://github.com/graphql-python/graphene
- https://www.apollographql.com/docs/federation/
- https://platform.ontotext.com/soml/intro.html
- https://knowgraphs.eu/ws2021/
- https://www.ontotext.com/knowledge-hub/research-projects/
Gremlin
Meetings
Brainstorming 2021-03-01
- https://wiki.tib.eu/confluence/display/openresearch/2021-01-18+Brainstorming+Session
- https://wiki.tib.eu/confluence/display/openresearch/2021-03-01+Brainstorming+Session
- https://wiki.tib.eu/confluence/display/openresearch/2021-03-08+Besprechungsnotizen
Fr. Sens JF Notes
in 2020 bis heute insgesamt knapp 4.000 Bearbeitungen von allen Usern, davon knapp 3.000 neue Seiten, davon knapp 2.000 Events.
TIBKAT hatte in 2018 über 11.000 neue Konferenzbände (in allen Technik-Wissenschaften) Fokus auf Informatik zeigt aber: OpenResearch hat insgesamt ca. 1.000 Event Series, DBLP hat 5.000 RWTH ist mit dem Import von DBLP-Serien in das Semantic-Media-Wiki-Format fast fertig, könnte ohne weitere Hindernisse in OpenResearch übernommen werden. Die aus DBLP importierten Serien werden gerade abgeglichen mit den Serien, die schon in OpenResearch drin stehen, und werden mit den notwendigen Provenance-Metadaten aus mehreren LOD-Quellen angereichert (Zusammenarbeit in der Community mit Simon Cobb, Master Librarian Uni Exeter, UK – er verwendet ein Toolkit, das große Datenmengen in kurzer Zeit bereinigen kann) Bisheriges Hindernis für Event-Import: unvollständige Signatur (z.B. Ordnungsnummer, Jahr, Land, Ort sind nicht zuverlässig in OpenResearch verfügbar) Deshalb wichtig: richtige Migrationsstrategie wählen, um die Interessen bzgl. Tempo und Qualität in angemessene Balance zu bringen z.B. 60% des OpenResearch-Bestands (d.h. die Events mit guten Metadaten) gehen in wenigen Tagen 80% in wenigen Wochen 95% dauert Monate und erfordert manuelle Kuratierung