đłđŽ Norwegian¶
This is an overview of all the datasets used in the Norwegian part of EuroEval. The datasets are grouped by their task - see the task overview for more information about what these constitute.
Sentiment Classification¶
NoReC¶
This dataset was published in this paper and is based on reviews from three different media organisations: Schibsted Media Group, Aller Media and NRK.
The original full dataset consists of 680,792 / 101,106 / 101,594 samples for training, validation and test, respectively. We use a split of 1,024 / 256 / 2,048 samples for training, validation and test, respectively. All the new splits are subsets of the original splits.
Here are a few examples from the training split:
{
"text": "Den som ikke blir rystende berÞrt av « De utvalgte » , mÄ vÊre forherdet til det immune .",
"label": "positive"
}
{
"text": "Under er noen av funksjonene som er dels unike for LG G3 :",
"label": "neutral"
}
{
"text": "Tilsvarende fÄr vi ogsÄ lavere score i 3DMark enn hva tilfellet er for f.eks . Xperia Z2 og Galaxy S5 .",
"label": "negative"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 5
- Prefix prompt:
FĂžlgende er anmeldelser og deres sentiment, som kan vĂŠre 'positiv', 'nĂžytral' eller 'negativ'.
- Base prompt template:
Anmeldelse: {text}
Sentiment: {label}
- Instruction-tuned prompt template:
Anmeldelse: {text}
Klassifiser sentimentet i anmeldelsen. Svar med 'positiv', 'nĂžytral' eller 'negativ'.
- Label mapping:
positiveâĄïžpositivneutralâĄïžnĂžytralnegativeâĄïžnegativ
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset norec
Named Entity Recognition¶
NorNE-nb¶
This dataset was published in this paper and is a manually NER annotated version of the BokmÄl Universal Dependencies treebank. The NER labels almost follow the CoNLL-2003 standard, but with some additional labels.
The original full dataset consists of 15,696 / 2,410 / 1,939 samples for training, validation and test, respectively. We use a split of 1,024 / 256 / 2,048 samples for training, validation and test, respectively. The splits we use are new, so there might be some samples from the training split in the validation or test splits.
We have mapped the labels into the CoNLL-2003 standard as follows:
LOCâĄïžLOCPERâĄïžPERORGâĄïžORGMISCâĄïžMISCGPE_LOCâĄïžLOCGPE_ORGâĄïžORGPRODâĄïžMISCDRVâĄïžMISCEVTâĄïžMISC
Here are a few examples from the training split:
{
"tokens": array(['Det', 'fremkommer', 'av', 'Ärsmeldingene', 'fra', 'Bergen', 'helserÄd', 'i', 'Ärene', '1952', '-', '66', '.'], dtype=object),
"labels": array(['O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O'], dtype=object)
}
{
"tokens": array(['Viktig', 'var', 'det', 'ogsÄ', 'at', 'Kina', 'allerede', 'var', 'blitt', 'sÄ', 'avhengig', 'av', 'det', 'amerikanske', 'markedet', 'og', 'av', 'dollaren', ',', 'at', 'en', 'nedgang', 'i', 'USA', 'ogsÄ', 'ville', 'ramme', 'Kina', 'hardt', '.'], dtype=object),
"labels": array(['O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'B-ORG', 'O', 'O'], dtype=object)
}
{
'tokens': array(['Han', 'tok', 'fram', 'pistolen', 'og', 'dro', 'tilbake', 'til', 'Skaregata', '2', '.'], dtype=object),
'labels': array(['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'O'], dtype=object)
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 8
- Prefix prompt:
FĂžlgende er fraser og JSON-ordbĂžker med de navngitte enhetene som forekommer i den gitte frasen.
- Base prompt template:
Frase: {text}
Navngitte enheter: {label}
- Instruction-tuned prompt template:
Frase: {text}
Identifiser de navngitte enhetene i frasen. Du bĂžr outputte dette som en JSON-ordbok med nĂžklene 'person', 'sted', 'organisasjon' og 'diverse'. Verdiene skal vĂŠre lister over de navngitte enhetene av den typen, akkurat som de vises i frasen.
- Label mapping:
B-PERâĄïžpersonI-PERâĄïžpersonB-LOCâĄïžstedI-LOCâĄïžstedB-ORGâĄïžorganisasjonI-ORGâĄïžorganisasjonB-MISCâĄïždiverseI-MISCâĄïždiverse
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset norne-nb
NorNE-nn¶
This dataset was published in this paper and is a manually NER annotated version of the Nynorsk Universal Dependencies treebank. The NER labels almost follow the CoNLL-2003 standard, but with some additional labels.
The original full dataset consists of 14,174 / 1,890 / 1,511 samples for training, validation and test, respectively. We use a split of 1,024 / 256 / 2,048 samples for training, validation and test, respectively. The splits we use are new, so there might be some samples from the training split in the validation or test splits.
We have mapped the labels into the CoNLL-2003 standard as follows:
LOCâĄïžLOCPERâĄïžPERORGâĄïžORGMISCâĄïžMISCGPE_LOCâĄïžLOCGPE_ORGâĄïžORGPRODâĄïžMISCDRVâĄïžMISCEVTâĄïžMISC
Here are a few examples from the training split:
{
"tokens": array(['-', 'Ulfr', 'provoserer', 'kjapt', 'fram', 'eit', 'slagsmÄl', ',', 'og', 'han', 'drep', 'hovdingen', '.'], dtype=object),
"labels": array(['O', 'B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O'], dtype=object)
}
{
"tokens": array(['I', 'haust', 'blei', 'det', 'avslÞrt', 'at', 'minst', 'to', 'tolvÄringar', 'pÄ', 'mellomtrinnet', 'ved', 'Gimle', 'skule', 'hadde', 'med', 'seg', 'alkohol', 'pÄ', 'ein', 'skuletur', '.'], dtype=object),
"labels": array(['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O'], dtype=object)
}
{
"tokens": array(['Krigen', 'mot', 'Irak', 'skulle', 'aldri', 'ha', 'vore', 'gjennomfĂžrd', '.'], dtype=object),
"labels": array(['O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O'], dtype=object)
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 8
- Prefix prompt:
FĂžlgende er fraser og JSON-ordbĂžker med de navngitte enhetene som forekommer i den gitte frasen.
- Base prompt template:
Frase: {text}
Navngitte enheter: {label}
- Instruction-tuned prompt template:
Frase: {text}
Identifiser de navngitte enhetene i frasen. Du bĂžr outputte dette som en JSON-ordbok med nĂžklene 'person', 'sted', 'organisasjon' og 'diverse'. Verdiene skal vĂŠre lister over de navngitte enhetene av den typen, akkurat som de vises i frasen.
- Label mapping:
B-PERâĄïžpersonI-PERâĄïžpersonB-LOCâĄïžstedI-LOCâĄïžstedB-ORGâĄïžorganisasjonI-ORGâĄïžorganisasjonB-MISCâĄïždiverseI-MISCâĄïždiverse
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset norne-nn
Linguistic Acceptability¶
ScaLA-nb¶
This dataset was published in this paper and was automatically created from the BokmÄl Universal Dependencies treebank by assuming that the documents in the treebank are correct, and corrupting the samples to create grammatically incorrect samples. The corruptions were done by either removing a word from a sentence, or by swapping two neighbouring words in a sentence. To ensure that this does indeed break the grammaticality of the sentence, a set of rules were used on the part-of-speech tags of the words in the sentence.
The original dataset consists of 20,044 samples, from which we use 1,024 / 256 / 2,048 samples for training, validation and testing, respectively (so 3,328 samples used in total). These splits are used as-is in the framework.
Here are a few examples from the training split:
{
"text": "En vellykket gjennomfÞring av denne reformen vil bli en avgjÞrende prÞve pÄ Regjeringens handlekraft.",
"label": "correct"
}
{
"text": "Lunde var ikke blant, mener Andreassen.",
"label": "incorrect"
}
{
"text": "72 kjoler gÄr hver med sesong.",
"label": "incorrect"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 12
- Prefix prompt:
FĂžlgende er setninger og hvorvidt de er grammatisk korrekte.
- Base prompt template:
Setning: {text}
Grammatisk korrekt: {label}
- Instruction-tuned prompt template:
Setning: {text}
Bestem om setningen er grammatisk korrekt eller ikke. Svar med 'ja' hvis setningen er korrekt og 'nei' hvis den ikke er.
- Label mapping:
correctâĄïžjaincorrectâĄïžnei
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset scala-nb
ScaLA-nn¶
This dataset was published in this paper and was automatically created from the Nynorsk Universal Dependencies treebank by assuming that the documents in the treebank are correct, and corrupting the samples to create grammatically incorrect samples. The corruptions were done by either removing a word from a sentence, or by swapping two neighbouring words in a sentence. To ensure that this does indeed break the grammaticality of the sentence, a set of rules were used on the part-of-speech tags of the words in the sentence.
The original dataset consists of 17,575 samples, from which we use 1,024 / 256 / 2,048 samples for training, validation and testing, respectively (so 3,328 samples used in total). These splits are used as-is in the framework.
Here are a few examples from the training split:
{
"text": "Dersom Noreg snart gÄr forbi Danmark i folketal, slik framskrivingane tilseier, kan ogsÄ dette langt pÄ veg forklarast med naturressursar.",
"label": "correct"
}
{
"text": "Eg kan ikkje sjÄ at det er grunn til Ä ha ei slik grense i lova, det kan vurderast i, seier ho.",
"label": "incorrect"
}
{
"text": "SV har elles levert og i dag framsett ei gode forslag som kan bidra til Ä gjera noko med straumprisproblematikken og straumforbruket, om viljen vÄr er der.",
"label": "incorrect"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 12
- Prefix prompt:
FĂžlgende er setninger og hvorvidt de er grammatisk korrekte.
- Base prompt template:
Setning: {text}
Grammatisk korrekt: {label}
- Instruction-tuned prompt template:
Setning: {text}
Bestem om setningen er grammatisk korrekt eller ikke. Svar med 'ja' hvis setningen er korrekt og 'nei' hvis den ikke er.
- Label mapping:
correctâĄïžjaincorrectâĄïžnei
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset scala-nn
Unofficial: NoCoLA¶
This dataset was published in this paper
and is based on the annotated language learner corpus
ASK. Notably, the individual types of errors are
also annotated in this dataset. We use the error types to ensure that there is an equal
representation of each error type, but then collapse the error types into correct and
incorrect.
The original dataset consists of 116,199 / 14,293 / 14,387 samples for training, validation and test, respectively. We use 1,024 / 256 / 2,048 samples for training, validation and test, respectively, where we sample each error type equally. All splits are subsets of the original splits.
Here are a few examples from the training split:
{
"text": "Vi har hatt krig i nesten ti Är. Jeg fÞler meg noen ganger trist fordi jeg har mistet flere venner og min far pÄ grunn av krigen.",
"label": "correct"
}
{
"text": "Hvis jeg ikke sier in n genting, kan han spille hele dagen.",
"label": "incorrect"
}
{
"text": "De fĂžler at samfunnet trenger ikke dem.",
"label": "incorrect"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 12
- Prefix prompt:
FĂžlgende er setninger og hvorvidt de er grammatisk korrekte.
- Base prompt template:
Setning: {text}
Grammatisk korrekt: {label}
- Instruction-tuned prompt template:
Setning: {text}
Bestem om setningen er grammatisk korrekt eller ikke. Svar med 'ja' hvis setningen er korrekt og 'nei' hvis den ikke er.
- Label mapping:
correctâĄïžjaincorrectâĄïžnei
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset no-cola-binary
Unofficial: Jentoft¶
This dataset was published in this Master's thesis by Matias Jentoft.
The original dataset consists of 85,771 / 10,827 / 10487 samples for training,
validation and test, respectively. We use a split of 1,024 / 256 / 2,048 samples for
training, validation and test, respectively. In each split, the distribution of
correct and incorrect is 50/50.
Here are a few examples from the training split:
{
"text": "For to uker siden var jeg pÄ en fotoutstilling om Erytrea.",
"label": "incorrect"
}
{
"text": "Det viser seg at folk ikke kan leve uten mobiltelefonen.",
"label": "correct"
}
{
"text": "Mobiltelefoner dominerer mange av oss, og vi bruker dem over alt, pÄ gatene 'hvert hjÞrne', i gatene, holdeplasser, kaffeteriaene og i parken, der folk burde tilbringe koselig tid sammen i naturen.",
"label": "incorrect"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 12
- Prefix prompt:
FĂžlgende er setninger og hvorvidt de er grammatisk korrekte.
- Base prompt template:
Setning: {text}
Grammatisk korrekt: {label}
- Instruction-tuned prompt template:
Setning: {text}
Bestem om setningen er grammatisk korrekt eller ikke. Svar med 'ja' hvis setningen er korrekt og 'nei' hvis den ikke er.
- Label mapping:
correctâĄïžjaincorrectâĄïžnei
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset jentoft
Reading Comprehension¶
NorQuAD¶
This dataset was published in this paper and is a manually annotated dataset based on data from the BokmÄl Wikipedia.
The original full dataset consists of 3,810 / 472 / 472 samples for training, validation and test, respectively. We use a split of 1,024 / 256 / 2,048 samples for training, validation and test, respectively. When creating the splits, we only select samples that contain an answer in the associated context. The splits we use are new, so there might be some samples from the training split in the validation or test splits.
Here are a few examples from the training split:
{
"context": 'Sprekpodden: Denne treningen gjĂžr deg smartere og lykkeligere\nHJERNEFORSKER: â Hjernen er i utgangspunktet programmert for latskap. Derfor mĂ„ vi i stĂžrre grad tvinge oss selv til Ă„ vĂŠre mer aktive, sier forsker Ole Petter Hjelle. Foto: Tor Stenersen (arkiv)\nSPREKPODDEN: Denne uken har programleder Daniel RĂžed-Johansen og Malene IndrebĂž-Langlo besĂžk av Ole Petter Hjelle. Foto: Morten Uglum\nâ Vi var rett og slett lei av Ă„ sitte og fortelle pasientene vĂ„re at de mĂ„tte vĂŠre i fysisk aktivitet, uten at noe skjedde.\nFor noen Ă„r siden startet hjerneforsker og fastlege Ole Petter Hjelle, og de andre legene pĂ„ Ă
sgĂ„rdstrand legekontor, en treningsgruppe for pasientene sine. Det ble stor suksess.\nâ Folk vet at det er bra Ă„ trene for den fysiske helsen, men at fysisk aktivitet ogsĂ„ er bra for den mentale helse, er et underkommunisert tema, sier han.\nBedre enn sudoku og kryssord\nâ Er fysisk aktivitet bedre hjernetrim enn sudoku og kryssord?\nâ LĂžser du masse kryssord, sĂ„ blir du veldig til Ă„ lĂžse kryssord. Men det har ikke de store ringvirkningene pĂ„ vĂ„re kognitive funksjoner, som det Ă„ huske, planlegge og gjennomfĂžre, sier Hjelle.\nHan forklarer at nĂ„r pulsen vĂ„r Ăžker, skilles det ut vekstfaktorer i hjernen som beskytter hjernecellene vĂ„re og gjĂžr at cellene kommuniserer bedre.\nForskning viser ogsĂ„ at det dannes nye hjerneceller i enkelte deler av hjernen, under aktivitet.\nâ Men skal man fĂ„ denne effekten, mĂ„ man rett og slett vĂŠre i aktivitet.\nFĂ„ opp pulsen\nForskning viser ogsĂ„ at fysisk aktivitet reduserer risiko for depresjon og demens, Ăžker intelligensen, bedrer hukommelsen, gjĂžr deg mer kreativ og gir deg et lengre og bedre liv.\nHjelle forteller at det viktigste for Ă„ hente ut disse fordelene er Ă„ fĂ„ opp pulsen.\nâ Men dersom du skulle valgt en aktivitet â som i stĂžrst mulig grad stimulerte flest mulig hjerneomrĂ„der â pleier jeg Ă„ si ballspill. Da fĂ„r du opp pulsen, du samarbeider, har taktikk, koordinasjon, balanse og strategi, sier Hjelle.\nHĂžr mer fra «treningslegen» i ukens Sprekpodden her.',
"question": 'Hva jobber Daniel som?',
"answers": {
"answer_start": array([286]),
"text": array(['programleder'], dtype=object)
}
}
{
"context": 'Litauiske medier: En utvekslingsavtale skal vĂŠre pĂ„ plass for Frode Berg\nFrode Berg ble dĂžmt til 14 Ă„rs fengsel i Russland. Foto: Tore Meek / NTB scanpix\nRussland og Litauen er enige om Ă„ utveksle en spiondĂžmt russer mot to litauere og en nordmann, opplyser kilder i den litauiske sikkerhetstjenesten til den litauiske nyhetstjenesten Baltic News Service (BNS).\nâ Utvekslingsavtalen inkluderer ogsĂ„ en norsk statsborger som er dĂžmt i Russland, sier en anonym tjenestemann i den litauiske sikkerhetstjenesten.\nAvisen navngir ikke Frode Berg, men Berg er den eneste nordmannen som soner en slik dom i Russland.\nAftenposten og en rekke norske medier omtalte saken onsdag ettermiddag. Flere russiske medier melder ogsĂ„ om det samme, alle med BNS som kilde\nâ HĂ„per en avtale foreligger\nFrode Bergs norske advokat Brynjulf Risnes kan ikke bekrefte opplysningene.\nâ Jeg har ikke informasjon som verken bekrefter eller avkrefter en slik avtale. Vi hĂ„per selvsagt at en slik avtale foreligger, sier Risnes til NTB.\nUD vil ikke kommentere saken.\nâ Norske myndigheter Ăžnsker Ă„ fĂ„ Frode Berg hjem. Vi hĂ„ndterer saken pĂ„ den mĂ„ten som vi mener er best for Ă„ ivareta hans interesser. Utover det kommenterer vi ikke saken, sier underdirektĂžr Ane Haavardsdatter Lunde i Utenriksdepartementet til NTB.\nBergs russiske forsvarer, advokat Ilja Novikov, ikke vil kommentere saken, ifĂžlge NRK.\nStĂžttegruppen for Frode Berg hĂ„per opplysningene stemmer.\nâ Dersom det viser seg at dette er riktig, er det en ufattelig god nyhet som vi har ventet pĂ„ skulle skje, sier stĂžttegruppemedlem ThorbjĂžrn Brox Webber til NTB.\nâ En slik avtale mĂ„ bety at Frode kan komme tilbake til Norge og Kirkenes, legger han til.\nDĂžmt for spionasje\nBerg er dĂžmt til 14 Ă„rs fengsel for spionasje. Han ble pĂ„grepet i Moskva i desember 2017 og har sittet fengslet siden.\nNRK meldte i august at UD er i forhandlinger med Russland om Ă„ fĂ„ Berg hjem og har informert hans nĂŠrmeste familie om dette.\nMuligheten for en utvekslingsavtale har vĂŠrt antydet, men et problem har vĂŠrt hvem den i sĂ„ fall skal omfatte.',
"question": 'Hvilken norske advokat representerer Frode Berg?',
"answers": {
"answer_start": array([808]),
"text": array(['Brynjulf Risnes'], dtype=object)
}
}
{
"context": 'Ny nedtur for Ruud\nCasper Ruud rĂžk torsdag ut av challengerturneringen i Koblenz. Bildet er fra en tidligere turnering.\nAv Ole Henrik Tveten\nDet ble en frustrerende kamp mot nederlandske Tallpon Griekspoor torsdag. Casper Ruud vant fĂžrste sett 6-4, men etter det var det lite som stemte for nordmannen i Tyskland.\nI andre sett ble Ruud utspilt og tapte 1-6, mens feilene fortsatte Ă„ florere ogsĂ„ i tredje sett og Ruud tapte settet 2-6.\nDen norske 20-Ă„ringen gikk rett inn i 2. runde i Koblenz-turneringen etter Ă„ ha fĂ„tt walkover i den fĂžrste. Der slet han seg til seier mot italienske Raul Brancaccio onsdag. Torsdagens motstander, Tallpon Griekspoor, er nummer 233 pĂ„ verdensrankingen.\nDet startet bra for SnarĂžya-gutten da han i fĂžrste sett brĂžt nederlenderens serve og tok ledelsen 4-3. Servebruddet ble avgjĂžrende for settet som Ruud vant 6-4, etter blant annet Ă„ ha reddet en breakball etter en lengre ballveksling.\nI andre sett begynte problemene for Casper Ruud. Griekspoor brĂžt Ruuds serve ved fĂžrste anledning og gikk opp i 2-0-ledelse. Deretter vant han egen serve, brĂžt Ruuds serve pĂ„ ny og vant sĂ„ egen serve. Da ledet plutselig nederlenderen 5-0.\nNordmannen servet inn til 5-1, men det var dessverre ikke starten pĂ„ noen snuoperasjon. Nederlenderen vant settet 6-1.\nNordmannen hadde ikke ristet av seg problemene i pausen, og ble feid av banen av Griekspoor. Ruud kom under 0-4 i tredje sett fĂžr han omsider reduserte til 1-4. Men da var det for sent.\nNederlenderen servet inn 5-1, Ruud reduserte, fĂžr Griekspoor servet seieren i land. Dermed tapte Ruud tredje sett 6-2 og rĂžk ut av turneringen.\nĂ
ryke ut i Tyskland hjelper ikke nordmannens jakt pÄ rankingpoeng for Ä komme seg inn i topp 100 i verden. Han risikerer Ä falle flere plasser ettersom han mister de 70 rankingpoengene han skaffet seg da han tok seg til 2. runde i Australian Open i fjor. Ruud er akkurat nÄ nummer 112 pÄ verdensrankingen. (NTB)',
"question": 'Hvordan endte 1. sett mellom Ruud og Griekspoor?',
"answers": {
"answer_start": array([244]),
"text": array(['6-4'], dtype=object)
}
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 2
- Prefix prompt:
Her fÞlger tekster med tilhÞrende spÞrsmÄl og svar.
- Base prompt template:
Tekst: {text}
SpÞrsmÄl: {question}
Svar pÄ maks 3 ord: {label}
- Instruction-tuned prompt template:
Tekst: {text}
Besvar fÞlgende spÞrsmÄl om teksten ovenfor med maks 3 ord.
SpÞrsmÄl: {question}
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset norquad
Unofficial: NorGLM Multi QA¶
This dataset was released in this paper and
features a manually annotated reading comprehension dataset based on Norwegian news
articles. This dataset is an abstractive question answering dataset, meaning that the
answers do not always feature in the context. To fix this, they were rephrased using
this
script,
which utilised the gpt-4o-2024-05-13 model.
The original dataset contains 2,406 samples, which we split into 1,024 / 256 / 1,126 samples for training, validation and test, respectively.
Here are a few examples from the training split:
{
"context": ' Kommer det melding om at ansatte kjĂžper aksjer i eget selskap, kan det vĂŠre gode grunner til at du ogsĂ„ bĂžr gjĂžre det. â VĂŠr pĂ„ lag med innsiderne, er ekspertens rĂ„d.Har du lyst til Ă„ prĂžve deg som aksjeinvestor helt gratis og uten reell risiko? Meld deg pĂ„ Aksje-NM her!Mange assosierer innsidehandel med kjĂžp og salg av aksjer basert pĂ„ tilgang pĂ„ selskapsnyheter fĂžr de blir offentliggjort i markedet. Slik handel kan gi stor Ăžkonomisk gevinst, og er ulovlig.Det finnes derimot ogsĂ„ en lovlig form for innsidehandel, og denne kan det vĂŠre lurt Ă„ fĂžlge med pĂ„, skal vi tro forskningssjef Geir LinlĂžkken i Investtech. Aksjeskolen er en del av E24s Aksje-NM. En tidligere versjon av denne artikkelserien ble publisert i 2020.NĂ„r man snakker om «innsidehandel» i bĂžrssammenheng, siktes det som regel til handler som direktĂžrer, styremedlemmer og andre nĂžkkelmedarbeidere gjĂžr. Disse handlene mĂ„ rapporteres inn til Oslo BĂžrs, og kjĂžpet eller salget blir offentlig informasjon. Denne informasjonen kan vĂŠre gull verdt, skal vi tro forskningen til Investtech.â NĂžkkelpersoner som direktĂžrer og styremedlemmer sitter pĂ„ veldig mye kunnskap om bedriften. NĂ„r disse enten selger eller kjĂžper aksjer i eget selskap, kan det ses pĂ„ som et signal til andre aktĂžrer, sier LinlĂžkken. LinlĂžkken har forsket pĂ„ innsidehandel og tatt utgangspunkt i over 11.000 rapporterte innsidekjĂžp i norske og svenske selskaper. Han har sett nĂŠrmere pĂ„ hvordan kursen utviklet seg i tiden etter innsidekjĂžpet. â Vi fant at disse selskapene pĂ„ Ă„rlig basis steg med 7,1 prosentpoeng mer enn andre selskaper. Det kan altsĂ„ vĂŠre et godt tips Ă„ fĂžlge med pĂ„ innsidekjĂžp.Dersom det tikker inn meldinger om at innsidere selger aksjene sine, er det ogsĂ„ lurt Ă„ fĂžlge nĂžye med. Investtech har tatt utgangspunkt i over 6.900 slike tilfeller i Norge og Sverige, og gjorde spennende funn. â I snitt gjorde disse aksjene det 3,0 prosentpoeng svakere enn bĂžrsen, sier han. LinlĂžkken forteller at noen av aksjene kan ha falt for eksempel 50 prosent etter innsidesalg, mens det kan ha gĂ„tt ganske bra i andre selskaper med innsidesalg.â Men i gjennomsnitt har disse aksjene gjort det dĂ„rlig, fastslĂ„r han.LinlĂžkken sier at Investtech anser innsidehandelanalyse som en forenklet fundamental analyse, altsĂ„ en analyse av om aksjen er billig eller dyr i forhold til verdiene i selskapet. Har man ikke tid eller kunnskap til Ă„ gjĂžre slik analyse selv, er det et godt alternativ Ă„ se til innsiderne. â Historisk og statistisk sett, har det vĂŠrt riktig Ă„ fĂžlge innsiderne og vĂŠre pĂ„ lag med dem, svarer LinlĂžkken.',
"question": 'Hva kan man gjĂžre dersom man ikke har tid eller kunnskap til Ă„ gjĂžre en analyse av aksjene til et selskap?',
"answers": {
"answer_start": 2434,
"text": array(['Se til innsiderne.'], dtype=object)
}
}
{
"context": ' Alt om pubertet, penis, psyken og livet sjĂŠl. Nok en fullkommen bok fra duoen bak et par av de stĂžrste boksuksessene de siste Ă„rene. «De har gjort det igjen», skrev jeg i VG for ganske nĂžyaktig to Ă„r siden, da jeg satt her og leste og anmeldte «Jenteboka» av legene Nina Brochmann og Ellen StĂžkken Dahl. Da hadde det gĂ„tt to Ă„r siden de brak-debuterte med «Gleden med skjeden». Jeg gav «Jenteboka» terningkast 6. Vel, vel. Du har kanskje gjettet det nĂ„, men nĂ„ har de altsĂ„ gjort det enda en gang: Laget en knallgod, fullkommen bok vi fĂ„r hĂ„pe mange leser.For jeg tĂžr pĂ„stĂ„ at guttene trenger sin Guttebok vel sĂ„ mye som jentene trenger sin. For selv om det er jentene vi har snakket mest om, er det mange unge gutter som sliter. Unge gutter faller oftere ut av skolen, er mer deprimerte og har mindre fremtidsoptimisme enn fĂžr. Det finnes dyster statistikk, kort fortalt: De opplever ogsĂ„ stress og press og uhelse. Og sĂ„ er de ikke sĂ„ flinke til Ă„ snakke om det. I «Gutteboka» tar Brochmann og Dahl for seg alt man mĂ„ vite og forstĂ„ nĂ„r man er pĂ„ vei inn i eller stĂ„r midt i puberteten. (Eller senere i livet, for den saks skyld, jeg plukket opp noen gode tips selv, jeg.) De skriver om kroppshĂ„r, kviser, stemmeskifte, legning, penisstĂžrrelse, pung, kjĂžnn, sĂŠd, kĂ„thet, ereksjonsknipe (!) og svettelukt, for Ă„ nevne noen av mange hĂžydepunkter. Legeduoen havnet pĂ„ denne lista: De ti heteste norske forfatterne i utlandet! Foruten alle de rent kroppslige og fysiske forandringene man kan oppleve pĂ„ veien fra gutt til mann, inneholder boka gode kapitler om de psykiske aspektene og livet sjĂŠl. Grensesetting, samtykke, nettvett, om Ă„ trenge en pornopause, om psykisk uhelse, stress og press. «Alle har det vondt iblant, men ingen har det vondt for alltid. Du kommer til Ă„ bli glad igjen!» Det er noe med tonen i boka, som er sĂ„ fin. Lett, Ă„pen, sympatisk, avvĂŠpnende. Smart, kul og og med faglig tyngde. Men aldri formanende, ingen pekefinger. «Onani er godt og sunt. Onani er ikke bare ufarlig â det er bra for deg.» «Kroppen din er laget for Ă„ brukes og nytes.» «Det er synd at trening ender opp med Ă„ handle om bare utseendet. Ă
trene er nemlig bra for deg. Det er ikke jakten pĂ„ «drĂžmmekroppen».» Selv de mer alvorlige og kliniske temaene er dessuten en fornĂžyelse Ă„ bla om til, ogsĂ„ takket vĂŠre de fantastiske illustrasjonene til Magnhild Wisnes. De er fargerike og morsomme, og gjĂžr boka komplett. SĂ„ mange peniser har jeg ikke sett siden vi fniste og lo av «Penisatlaset» pĂ„ et nachspiel i studietiden. SĂ„ kan man jo stille seg spĂžrsmĂ„let, om denne boka nĂ„r frem til dem som trenger Ă„ lese den. Den burde egentlig vĂŠrt pensum, tenker jeg, eller i alle fall utgangspunkt for et prosjekt pĂ„ skolen. Ă
sette seg ned med en bok, som attpÄtil handler om puberteten, stÄr vel ikke hÞyest pÄ lista over hva tenÄringsgutter flest vil bruke fritiden sin pÄ. PrÞv likevel. Jeg vet ikke, kanskje betale gutten noen kroner for Ä lese den, om det er det som skal til. Jeg fÞler meg sikker pÄ at det vil vÊre verdt det. For hvis de unge guttene vÄre leser denne boka, er jeg sikker pÄ at livet blir lettere Ä leve og verden et morsommere sted. Anmeldt av: Trine Saugestad Hatlen',
"question": 'Hvem stÄr for illustrasjonene i «Gutteboka»?',
"answers": {
"answer_start": 2321,
"text": array(['illustrasjonene til Magnhild Wisnes'], dtype=object)
}
}
{
"context": ' Regjeringen lanserer ny handlingsplan for Ă„ beskytte den truede villaksen. â Altfor slapt, sier SV-politiker.Regjeringen lanserer nĂ„ en handlingsplan for Ă„ bevare den truede villaksen.â Villaksen kan nĂ„ bli rĂždlistet i Norge for fĂžrste gong. Det er helt klart at det trengs konkrete tiltak for Ă„ snu denne utviklingen, sier Sveinung Rotevatn i pressemeldingen fra regjeringen.Handlingsplanen inneholder tiltak mot blant annet lakselus, rĂžmt oppdrettsfisk, lakseparasitten Gyro, vannkraftregulering, forsuring, overbeskatning og fremmende fiskearter som pukkellaks.Regjeringen viser til at lakselus utgjĂžr den stĂžrste risikoen for Ă„ gjĂžre ytterligere skade pĂ„ vill atlantisk laks, ifĂžlge Vitenskapelig rĂ„d for lakseforvaltning.â Lakselus utgjĂžr en stor risiko for villaksen. Regjeringen vil blant annet utrede krav om nullutslipp av lakselus fra oppdrettsanlegg fra og med 2030, sier Rotevatn.Det vil i sĂ„ fall innebĂŠre krav om lukkede anlegg.Lakselus finnes naturlig i alle havomrĂ„der pĂ„ den nordlige halvkule, og er den vanligste parasitten pĂ„ laksefisk.Blir forekomsten av lus hĂžy, kan det vĂŠre en utfordring bĂ„de for oppdrettsfisk og vill laksefisk.Havbruk medfĂžrer at antall fisk i sjĂžen Ăžker, og dermed Ăžker ogsĂ„ antall verter for lakselus. NivĂ„ene med lakselus i anleggene mĂ„ derfor holdes lavest mulig, slik at de samlede lusemengdene i sjĂžen ikke blir for store.Som fĂžlge av omfattende resistens hos lusen mot kjemiske behandlingsmidler, har nĂŠringen de siste Ă„rene vĂŠrt tvunget til Ă„ ta i bruk mekaniske metoder for Ă„ fjerne lusen, med negative konsekvenser for fiskens velferd.Kilde: Lusedata, MattilsynetDagens trafikklyssystem som regulerer veksten i nĂŠringen i forhold til luseutviklingen, skal ogsĂ„ utvikles og forbedres.Planen inneholder ogsĂ„ tiltak mot en rekke andre pĂ„virkningsfaktorer. Utfisking av rĂžmt oppdrettslaks skal Ăžkes, og det skal vurderes nye metoder for Ă„ spore og merke oppdrettslaks og hindre at rĂžmt oppdrettslaks gyter.Hele 80 prosent av villaksbestandene i Norge nĂ„r for tiden ikke minstemĂ„let for god kvalitet. RĂžmt oppdrettslaks og lakselus er regnet som de to stĂžrste truslene, skriver regjeringen.Fremmende fiskearter utgjĂžr ogsĂ„ en risiko for bĂ„de biologisk mangfold, produktiviteten til lokal laksefisk og akvakultur.I Ă„r har Norge hatt den stĂžrste invasjonen av pukkellaks noensinne, og regjeringen vil derfor opprette en nasjonal kompetansegruppe for Ă„ koordinere arbeidet med dette.SVs nestleder Torgeir Knag Fylkesnes er ikke fornĂžyd med tiltakene.â Dette er altfor, altfor slapt. Regjeringen tar ikke tak i elefanten i rommet, nemlig den lite bĂŠrekraftige forvaltningen av oppdrettsnĂŠringa. Vi mĂ„ stille strengere miljĂžkrav til alle nye oppdrettstillatelser, og fase inn disse kravene hos de med eksisterende tillatelser, skriver han i en kommentar til E24.Han pĂ„peker at det i dag tildeles oppdrettstillatelser til den hĂžystbydende, og ikke til de med den mest miljĂžvennlige teknologien. â Skal vi redde villaksen og sikre en bĂŠrekraftig vekst for oppdrettsnĂŠringen, mĂ„ vi legge om systemet slik at vi gjennom Ă„ gi billigere tillatelser, men med krav om nullutslipp, null rĂžmming og null ressurser pĂ„ avveie.Fylkesnes understreker videre at teknologien finnes, og at nĂŠringen har god rĂ„d.â NĂ„r man for eksempel ser pĂ„ Salmars investeringsaktivitet de siste ukene, sĂ„ ser vi at nĂŠringen bĂ„de kan betale for ny teknologi og skatt pĂ„ formue og grunnrente.Fylkesnes gikk tidligere denne uken hardt ut mot Salmar-eier Gustav WitzĂže, etter at laksemilliardĂŠren uttalte seg kritisk mot Ăžkning i formuesskatten tidligere i sommer.',
"question": 'Hva inneholder regjeringens nye handlingsplan for villaksen?',
"answers": {
"answer_start": 377,
"text": array(['Handlingsplanen inneholder tiltak mot blant annet'], dtype=object)
}
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 2
- Prefix prompt:
Her fÞlger tekster med tilhÞrende spÞrsmÄl og svar.
- Base prompt template:
Tekst: {text}
SpÞrsmÄl: {question}
Svar pÄ maks 3 ord: {label}
- Instruction-tuned prompt template:
Tekst: {text}
Besvar fÞlgende spÞrsmÄl om teksten ovenfor med maks 3 ord.
SpÞrsmÄl: {question}
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset norglm-multi-qa
Unofficial: BeleBele-no¶
This dataset was published in this paper and features multiple-choice reading comprehension questions across 122 languages.
The original dataset contains 900 unique multiple-choice reading comprehension passages and questions. From these, we use a 256 / 64 / 580 split for training, validation and testing, respectively.
Here are a few examples from the training split:
{
"text": "Tekst: Det kinesiske nyhetsbyrĂ„et Xinhua meldte tidligere fra om at et fly var kapret. Det ble senere rapportert at flyet fikk en bombetrussel og ble veiledet mot retur til Afghanistan med landing i Kandahar. IfĂžlge de fĂžrste rapportene ble flyet dirigert tilbake til Afghanistan etter Ă„ ha blitt nektet nĂždlanding i ĂrĂŒmqi.\nSpĂžrsmĂ„l: Hva ble ikke sagt i den nyeste rapporten fra nyhetsbyrĂ„et Xinhua?\nSvaralternativer:\na. Flyet fikk en bombetrussel\nb. Flyet landet i ĂrĂŒmqi\nc. Flyet ble dirigert til Afghanistan\nd. Flyet landet i Kandahar",
"label": "b"
}
{
"text": "Tekst: Tyskland begynte Ä gjÞre seg klare til Ä invadere Storbritannia da kampen om Frankrike var over. Tyskland gav angrepet kodenavnet «operasjon sjÞlÞve». Mesteparten av den britiske hÊrens tunge vÄpen og forsyninger hadde gÄtt tapt da den flyktet fra Dunkirk, sÄ de var svÊrt sÄrbar. Den britiske marinen var imidlertid fremdeles mye kraftigere enn den tyske («Kriegsmarine») og kunne ha Þdelagt en eventuell invasjonsflÄte sendt over den engelske kanal. Det var likevel svÊrt fÄ skip fra Royal Navy som ble stasjonert nÊr de sannsynlige invasjonsrutene siden admiralene var engstelige for at de kom til Ä bli senket av tyske luftangrep.\nSpÞrsmÄl: Hva kalte Tyskland angrepet pÄ Storbritannia?\nSvaralternativer:\na. Dunkirk\nb. Operasjon sjÞlÞve\nc. Kriegsmarine\nd. Royal Navy",
"label": "b"
}
{
"text": "Tekst: Det italienske og det tyske landslaget er de nest beste lagene i verden og var FIFA World Cup-mestere i 2006. Fotball, basketball, volleyball, vannpolo, fekting, rugby, sykling, ishockey, rullehockey og Formel-1 bilsport er godt likte sportsgrener. Vintersport er mest populÊrt i nordlige omrÄder, der italienere deltar i internasjonale konkurranser og OL-arrangementer.\nSpÞrsmÄl: Hvilke av fÞlgende sporter vant et verdensmesterskap for Italia, basert pÄ informasjonen i avsnittet?\nSvaralternativer:\na. Fotball\nb. Vannpolo\nc. Basketball\nd. Sykling",
"label": "a"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 5
- Prefix prompt:
FÞlgende er flervalgsspÞrsmÄl (med svar).
- Base prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Svar: {label}
- Instruction-tuned prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Besvar fÞlgende spÞrsmÄl med 'a', 'b', 'c' eller 'd', og ikke noe annet.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset belebele-no
Unofficial: MultiWikiQA-nb¶
This dataset was published in this paper and contains Wikipedia articles with LLM-generated questions and answers in 300+ languages.
The original full dataset consists of 5,000 samples in a single split. We use a 1,024 / 256 / 2,048 split for training, validation and testing, respectively, sampled randomly.
Here are a few examples from the training split:
{
"context": "Cabaret Marzipan er et musikkalbum med Lumbago, innspilt i Nidaros Studios i Trondheim og utgitt i 1981 pĂ„ Polydor Records. Produsent er Nils B. Kvam. Dette er bandets andre og siste album.\n\nSporliste\n «Tanta mi rapper i supermarkedet» (Thanasis Zlatanos/Morten JĂžrgensen)\n «Pene jenter» (Thanasis Zlatanos/Stein Gulbrandsen/Morten JĂžrgensen)\n «Bare deg jeg tenker pÄ» (Stein Gulbrandsen/Trond Armand Larsen/Morten JĂžrgensen)\n «Natt» (Thanasis Zlatanos/Stein Gulbrandsen/Trond Armand Larsen/Morten JĂžrgensen)\n «En god dag idag» (Thanasis Zlatanos/Morten JĂžrgensen)\n «I gata der du bor» (Thanasis Zlatanos/Stein Gulbrandsen/Morten JĂžrgensen)\n «Sammen igjen» (Thanasis Zlatanos/Marilena Zlatanou/Stein Gulbrandsen/Morten JĂžrgensen)\n «Lumbagoid» (Thanasis Zlatanos/Stein Gulbrandsen/Trond Armand Larsen/Morten JĂžrgensen)\n «Eva» (Thanasis Zlatanos/Stein Gulbrandsen/Morten JĂžrgensen)\n «Totalklaustrofobi» (Thanasis Zlatanos/Stein Gulbrandsen/Morten JĂžrgensen)\n\nMedvirkende\n\nLumbago\n Morten JĂžrgensen - sang, flersang, orgel, flakse, casio vi-tone, lĂ„tskriver\n Thanasis Zlatanos - vokal pĂ„ Sammen igjen, gitarer, synthesizer, kor, emt-bombe, lĂ„tskriver, fotograf, coverdesign\n Stein Gulbrandsen - bass, kontrabass, piano, synthesizer, kor, lĂ„tskriver\n Trond Armand Larsen - trommer, perkusjon, marimba, vibrafon, casio vi-tone, orgel, programmering, kor, lĂ„tskriver\n\nĂvrige\n Trygve Mathiesen - flersang pĂ„ Pene jenter og I gata der du bor, coverdesign \n Anne Sandborg, Carl Otto Platou, Eva Storevik Tveit, Hilde NorrgrĂšn, Ivar Eidem, Mona Eggehagen, Tom Trussel, Cecilie, Geir, Ida, Ina, Ivan, Joachim, K. Udzen, Katja, Maijana, Mala og Martin - bakgrunnvokal pĂ„ I gata der du bor\n Marilena Zlatanou - gresk oversettelse pĂ„ Sammen igjen\n Nils Bjarne Kvam - produsent, miksing\n Hans Petter Danielsen - tekniker\n Tore Tambs Lyche - tekniker \n Ivar Finsen - tekniker\n Rune Nordal - miksing \n Bitte Petersen - fotograf\n Gunnhild Bakke - fotograf\n Jan Walaker - fotograf\n Trond Davidsen - fotograf\n Ole SchĂžning - coverdesign\n\nEksterne lenker \n\nMusikkalbum fra 1981\nLumbago-album",
"question": "NÄr kom Cabaret Marzipan ut?",
"answers": {
"answer_start": array([99]),
"text": array(["1981"], dtype=object)
}
}
{
"context": "Dagligvarehandelen er en frittstĂ„ende ukeavis for dagligvarebransjen og distribueres til alle landets dagligvareforretninger og kjedekontorer samt kiosker og bensinstasjoner med dagligvarer i sortimentet.\n\nLesere er ledere og mellomledere hos leverandĂžrer, agenter og kjedekontorer i dagligvarebransjen, samt PR- og informasjonsrĂ„dgivere og reklame- og formidlingsbyrĂ„er. Nettutgaven er et verktĂžy for alle leverandĂžrer av produkter og tjenester til dagligvarebransjen. MĂ„lgruppen er alle som driver butikk, enten de er selvstendige, ansatte eller franchisetakere. Dagligvarehandelen er et av Nordens mest leste fagtidsskrifter.\n\nUtgiver er Medier og Ledelse AS, og ansvarlig redaktĂžr er Are Knudsen. Daglig leder er Magne LerĂž.\n\nPublikasjoner\n\nHvem er hvem gir en oversikt over hovedkontorer og kjeder i de sentrale grupperingene i dagligvare detalj i Norge og Norden, samt de viktigste aktĂžrene i kiosk, â bensin og servicemarkedet. Her finner man adresser, telefonnummer etc. samt aktuelle kontaktpersoner i de ulike kjedene. Hvem er hvem benyttes som oppslagsverk i alle ledd i bransjen.\n\nTemanumre tar opp aktuelle saker i bransjen og varierer fra Ă„r til Ă„r. De distribueres sammen med Dagligvarehandelen til alle dagligvareforretninger, kjedekontorer samt kiosker og bensinstasjoner med dagligvarer i sortimentet.\n\nReferanser\n\nEksterne lenker\n Dagligvarehandelens hjemmeside\n\nNorske tidsskrifter\nDagligvarehandel",
"question": "Hvem har den daglige ledelsen av Dagligvarehandelen?",
"answers": {
"answer_start": array([717]),
"text": array(["Magne LerĂž"], dtype=object)
}
}
{
"context": "Timothy Evans (fÞdt 20. november 1924 i Merthyr Tydfil i South Wales, dÞd 9. mars 1950 ved henging) var en waliser anklaget for mordet pÄ sin kone og datter under et opphold i Notting Hill, London i november 1949. I januar 1950 ble Evans dÞmt for drapet pÄ datteren sin, og han ble dÞmt til dÞden ved henging pÄ grunn av dette. \n\nUnder rettssaken, hadde Evans anklaget naboen, John Christie, for Ä vÊre ansvarlig for begge drapene. Tre Är etter Evans sin rettssak og henging, ble det oppdaget at Christie var en seriemorder som hadde myrdet en rekke kvinner pÄ hans egen eiendom, inkludert hans egen kone, og disse oppdagelsene kastet alvorlig tvil om dommen mot at Timothy Evans var riktig. En offisiell undersÞkelse som ble foretatt seksten Är etter at Evans ble hengt bekreftet at Evans sin datter var blitt myrdet av Christie, og Evans ble deretter gitt en posthumt benÄdning. Denne saken genererte mye kontrovers og ble senere anerkjent som et justismord. Dette spilte en stor rolle i avskaffelsen av endelig dÞdsstraff i Storbritannia. \n\nHans biologiske far forlot familien i 1924 kort tid fÞr Evans ble fÞdt. Evans hadde en eldre sÞster Eileen og en yngre halvsÞster Maureen, som ble fÞdt etter at Evans mor giftet seg for andre gang i 1929. Som barn, hadde Evans problemer med Ä lÊre Ä snakke og han slet pÄ skolen. Etter en ulykke da han var Ätte Är, utviklet Evans en tuberkulÞs verucca pÄ hans hÞyre fot som aldri ble helt bra igjen, og som gjorde at han gikk glipp av betydelige mengder tid fra skolen pÄ grunn av flere omfattende behandlinger. Derfor klarte han verken Ä lese eller skrive noe utover hans eget navn som voksen. Som barn, ble Evans ansett for Ä ha et dÄrlig temperament og han hadde flere raserianfall. \n\nDen 20. september 1947 giftet Evans seg med Beryl Susanna Thorley, som han hadde mÞtt gjennom en felles venn av dem. Timothy og Beryl fikk datteren Geraldine som ble fÞdt 10. oktober 1948. Deres ekteskap var preget av flere store krangler, forsterket av Beryl sitt dÄrlige renhold og manglende evne til Ä hÄndtere familiens Þkonomi. Timothy fikk etter hvert stÞrre og stÞrre problemer hans tunge drikking som forverret hans allerede korte temperament. \n\nPÄ slutten av 1949, ble Beryl ut at hun var gravid med deres andre barn. Siden familien allerede slet Þkonomisk, bestemte Beryl seg for at det eneste valget var Ä ta abort, og etter noe motvilje, godtok Evans denne beslutningen. Flere uker senere, 30. november 1949, informerte Evans politiet at han hadde drept sin kone. Hans fÞrste tilstÄelse var at han hadde ved et uhell hadde drept henne ved Ä gi henne noe i en flaske som en mann hadde gitt til ham for Ä avbryte graviditeten. Deretter skal han ha kastet liket i en kloakk i nÊrheten av hjemmet deres, men politiet fant ingenting pÄ det angitte stedet i kloakk-systemet og forklaringen ble ikke godtatt som ekte. Til tross for flere svake indisier brukte juryen bare 40 minutter pÄ Ä finne Evans skyldig i drapene pÄ hans kone og barn.\n\nReferanser \n\nBriter dÞmt for forbrytelser\nWalisere\nPersoner som har blitt benÄdet\nPersoner dÞmt for drap\nPersoner utsatt for justismord\nHenrettede personer",
"question": "Hvem var den seriemorderen som bodde i Evans' nabolag?",
"answers": {
"answer_start": array([377]),
"text": array(["John Christie"], dtype=object)
}
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 2
- Prefix prompt:
Her fÞlger tekster med tilhÞrende spÞrsmÄl og svar.
- Base prompt template:
Tekst: {text}
SpÞrsmÄl: {question}
Svar pÄ maks 3 ord: {label}
- Instruction-tuned prompt template:
Tekst: {text}
Besvar fÞlgende spÞrsmÄl om teksten ovenfor med maks 3 ord.
SpÞrsmÄl: {question}
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset multi-wiki-qa-nb
```text
### Unofficial: MultiWikiQA-nn
This dataset will be published in an upcoming paper, and contains Norwegian Nynorsk
Wikipedia articles with generated questions and answers, using the LLM Gemini-1.5-pro.
The original full dataset consists of 5,000 samples in a single split. We use a 1,024 /
256 / 2,048 split for training, validation and testing, respectively, sampled randomly.
Here are a few examples from the training split:
```json
{
"context": "Peter HÞeg () er ein dansk forfattar, som vart verdskjend med romanen FrÞken Smillas fornemmelse for sne (1992).\n\nLiv og forfattarskap \nHÞeg er oppvaksen i KÞbenhavn, kor han i 1984 vart ferdigutdanna som mag. art. i litteraturvitskap. Etter ein omflakkande periode som m.a. globetrotter, idrettslÊrar og dansar debuterte HÞeg i 1988 med Forestilling om det tyvende Ärhundret pÄ Rosinante forlag. Romanen, som er ein sterkt fabulerande slektskrÞnike, ber tydelege spor av sÞramerikansk magisk realisme og tiltrekte seg relativt stor merksemd allereie ved utgjevinga. I 1990 kom FortÊllinger om natten ut, 9 noveller med tematisk samanheng, og med denne utgjevinga vart HÞeg snart omtalt som eit forfattartalent med internasjonalt potensiale. Det endelege nybrottet lot ikkje venta pÄ seg.\n\nI 1992 kom kriminalromanen FrÞken Smillas fornemmelse for sne ut, eit portrett av den dansk-grÞnlandske glasiologen Smilla. Romanen sementerer HÞegs fÞretrekte tema og understrekar sympatiane i forfattarskapen for det kvinnelege prinsippet, for barnet og dei marginaliserte, samtidig som han byr pÄ ein god del kritikk av den vestlege sivilisasjon sin imperialisme og vitskapen sin maktmisbruk.\n\nHÞeg vart rost til skyane for sin store fortellerevne, sin sprÄklege evne og selde no uhÞyrt mange bÞker samanlikna med danske standardar, men sÊrleg med utgjevinga av De mÄske egnede (1993) begynte kritikken Ä dukka opp. Omtalarar anklaga HÞegs forfattarskap for politisk korrektheit, fÞreseieleg sivilisasjonskritikk og lettkjÞpt frelstheit. Med nÊrskyld sivilisasjonskritisk tematikk kunne romanen Kvinnen og aben (1996) alt anna enn retta opp i dette, samtidig som stiftinga av fondet Lolwe til stÞtte for kvinner og born i Den tredje verda ikkje just fekk kritikken til Ä tagna. Etter Kvinnen og aben lot forfattaren ikkje hÞyra meir frÄ seg utanom eit enkelt, personleg dikt med tittelen FÞrste og siste kapitel i antologien Trykt - og godt (1998) til HÞegs forleggar og nÊre ven, Merethe Riis. I staden trekte HÞeg seg heilt tilbake frÄ det offentlege rampelyset. I ei Ärrekke budde han ved Vekstsenteret i NÞrre Snede, eit spirituelt treningssenter med undervisning i meditativ praksis og sjÞlvutvikling.\n\nTrass kritikken vert forfattarskapen hans endÄ stadig rekna for vesentleg, og noko tyder pÄ at det mÞter fornya interesse. SÄleis kom forfattarskapsportrett Apa si poetikk ut vÄren 2005, ein kronologisk litteraturvitskapleg kritikk av HÞegs tekstar. SjÞlv gav forfattaren, etter 10 Ärs skjÞnnlitterÊr tagnad, ut romanen Den stille jenta i mai 2006.\n\nI 2010 gav Peter HÞeg ut romanen Elefantpassernes bÞrn.\n\nNÊrframtidsromanen Effekten av Susan (2014) trekker, med sin bruk av ei sterk kvinne med spesielle evnar som hovudfigur, linjer tilbake til 'Smilla'.\n\nPrisar \nPeter HÞeg har teke i mot mange litterÊre prisar, mellom dei: \n Weekendavisens litteraturpris (1988)\n Kritikarprisen (1993)\n Herman Bangs Mindelegat (1993) \n De Gyldne LaurbÊr (1994).\n GlassnÞkkelen for Smillas fornemmelse for sne\n\nFilmatisering \nI 1997 filmatiserte Bille August FrÞken Smillas fornemmelse for sne. Filmen vart ein fiasko, bÄde i omtalene og i salstala.\n\nBibliografi \n Forestilling om det tyvende Ärhundre (1988)\n Fortellinger om natten (1990)\n FrÞken Smillas fornemmelse for sne (1992)\n De mÄske egnede (1993)\n Kvinnen og apen (1996)\n Den stille piken (2006)\n Elefantpassernes bÞrn (2010)\n Effekten af Susan (2014)\n Gennem dine Þjne (2018)\n\nKjelder \n\nDanske romanforfattarar\nStatens Kunstfonds hÊdersydelse\nFolk frÄ KÞbenhavn\nVinnarar av GlassnÞkkelen",
"question": "Kven laga filmen basert pÄ FrÞken Smillas kjensle for snÞ?",
"answers": {
"answer_start": array([3033]),
"text": array(["Bille August"], dtype=object)
}
}
{
"context": "For den tidlegare kyrkja i Eidsberg, sjĂ„ Hen kyrkje i Eidsberg\nHen kyrkje ligg sentralt i bygda Isfjorden i Rauma kommune.\n\nKyrkja vart bygd i 1831 av grĂ„stein, tak-konstruksjonen og klokketĂ„rnet er av treverk.\n\nKyrkja er bygd pĂ„ den same plassen der ei eldre kyrkje stod fĂžr. Denne var i sĂ„ dĂ„rleg tilstand at ho mĂ„tte rivast. Ei gammal kyrkjeklokke frĂ„ 1200-talet er bevart og er i dag pĂ„ Romsdalsmuseet pĂ„ Molde.\n\nInteriĂžret\nPreikestolen som vert brukt i dag er frĂ„ 1930-Ă„ra.\n\nAltertavla vart laga til kyrkja i 1831. Ein eldre preikestol, som ikkje er i bruk, er plassert midt i altertavla. DĂ„ kyrkja vart restaurert i 1931, mĂ„la Halvard Hatlen eitt nytt bilde i altertavla. \n\nElles finst det eit rosemĂ„la skap frĂ„ 1788. Halvard Hatlen har mĂ„la seks portrett av tidlegare prestar. Desse heng langs langveggane. Han har ĂČg mĂ„la et mĂ„leri (1942), som heng i koret.\n\nKjelde\n Thaule, John Ove; Ubostad, Ingar; Pedersen, BjĂžrn. 1990. Kyrkjene vĂ„re i Ei bok om Rauma, Rauma Kommune. s 207-210\n\nBakgrunnsstoff\n \n\nKyrkjer i Rauma\nKyrkjer i Indre Romsdal prosti\nKulturminne i Rauma\nNorske kyrkjer frĂ„ 1831\nLangkyrkjer i MĂžre bispedĂžmme",
"question": "NÄr vart rosemÄlingane i Hen kyrkje laga?",
"answers": {
"answer_start": array([718]),
"text": array(["1788"], dtype=object)
}
}
{
"context": "Christophorus Clavius (fĂždd Christoph Klau 1537/38 i Bamberg i Tyskland, dĂžd 1612 i Roma) var ein tysk matematikar, astronom og jesuittpater pĂ„ 1500-talet. I samtida vart han kalla «kongen av matematikken», og vart framfĂžrt alt kjend for arbeidet sitt ved det vatikanske stjerneobservatoriet som fĂžrte til utviklinga av det nye kalendersystemet som vart kalla opp etter pave Gregor XIII, den gregorianske kalenderen. \n\nClavius tredde inn i jesuittordenen i 1555 og fekk utdanninga si i ordenen. Ved jesuittane sitt Collegio Romano i Roma studerte han teologi og underviste deretter matematikk der i ein lang periode. Clavius forfatta fleire matematikkbĂžker og medverka slik til utviklinga av matematikken. Ein vidt utbreidd kommentar til euklidsk geometri stammer frĂ„ han. Clavius medverka ĂČg til teorien for prostaferese, ein reknemetode som var ein forlĂžpar for logaritmane. Verka hans kom ut i 1612 i Mainz i fem band.\n\nMĂ„nekrateret Clavius er kalla opp etter han.\n\nKjelder\nDenne artikkelen bygger pĂ„ «Christophorus Clavius» frĂ„ , den 1. november 2011. \n \n\nFĂždde i 1530-Ă„ra\nDĂžde i 1612\nFolk frĂ„ Bamberg\nTyske katolske prestar\nTyske matematikarar\nTyske astronomar\nTyske jesuittar\nMatematikarar pĂ„ 1500-talet\nMatematikarar pĂ„ 1600-talet",
"question": "Kva fÞdselsÄr hadde Clavius?",
"answers": {
"answer_start": array([43]),
"text": array(["1537/38"], dtype=object)
}
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 2
- Prefix prompt:
Her fÞlger tekster med tilhÞrende spÞrsmÄl og svar.
- Base prompt template:
Tekst: {text}
SpÞrsmÄl: {question}
Svar pÄ maks 3 ord: {label}
- Instruction-tuned prompt template:
Tekst: {text}
Besvar fÞlgende spÞrsmÄl om teksten ovenfor med maks 3 ord.
SpÞrsmÄl: {question}
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset multi-wiki-qa-nn
Knowledge¶
NRK Quiz QA¶
This dataset was published in this paper and is a multiple-choice question answering (QA) dataset designed for evaluation of the Norwegian language and culture, including both BokmÄl and Nynorsk. The dataset consists of quizzes from NRK, the national public broadcaster in Norway.
The original dataset contains 4,930 samples, spread across 549 quizzes. We keep the top-256 quizzes, allowing us to create splits stratified across all the remaining quizzes. We 635 / 256 / 2048 samples for training, validation and test, respectively.
Here are a few examples from the training split:
{
"text": "Gunnar har hatt plutselige og sterke smerteanfall siden han var liten gutt. Det var vondt Ă„ tisse og det gjorde vondt i ryggen og magen. Det hjalp litt Ă„ drikke vann. Reseptbelagte medisiner kan vĂŠre nĂždvendig under anfall.\nSvaralternativer:\na. Nyrestein, kronisk\nb. Irritabel tarmsyndrom\nc. Angst\nd. Urinveisinfeksjon",
"label": "a"
}
{
"text": "80 Är gamle Harrison Ford er nok ein gong aktuell i rolla som Indiana Jones. Kva heiter filmen?\nSvaralternativer:\na. Indiana Jones and the Nasty Nazis\nb. Indiana Jones and the Dial of Destiny\nc. Indiana Jones and the Hunt for Power\nd. Indiana Jones Forever",
"label": "b"
}
{
"text": "I 1980 mÄtte denne bassisten overnatte ni netter i fengsel i Japan fordi han prÞvde Ä fÄ med seg ca. 200 gram marihuana inn i landet. Hvem var det?\nSvaralternativer:\na. Sting\nb. Lemmy Kilmister\nc. Paul McCartney\nd. Bootsy Collins",
"label": "c"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 5
- Prefix prompt:
FÞlgende er flervalgsspÞrsmÄl (med svar).
- Base prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Svar: {label}
- Instruction-tuned prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Besvar fÞlgende spÞrsmÄl med 'a', 'b', 'c', eller 'd', og ikke noe annet.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset nrk-quiz-qa
Idioms-no¶
This dataset was published here and consists of 3,553 Norwegian idioms and phrases that appear more than 100 times in the online library of the National Library of Norway.
We have reformulated the dataset as a multiple-choice question format with 4 options, where the alternative answers have been generated using GPT-4o. Based on 3,232 samples (3,144 BokmÄl, 88 Nynorsk) from the original dataset, we use a 928 (27 Nynorsk) / 256 (11 Nynorsk) / 2,048 (50 Nynorsk) split for training, validation and testing, respectively.
Here are a few examples from the training split:
{
"text": "Complete the Nynorsk idiom:\nalle gode ting er _____\n\nSvaralternativer::\na. sĂžte\nb. tre\nc. fire\nd. vennlege",
"label": "b"
}
{
"text": "Complete the BokmÄl idiom:\ndet er ikke bare , _____\n\nSvaralternativer::\na. moro\nb. bare\nc. lett\nd. enkelt",
"label": "b",
}
{
"text": "Complete the BokmÄl idiom:\ndet fÄr stÄ sin _____\n\nSvaralternativer::\na. prÞve\nb. vegg\nc. sak\nd. greie",
"label": "a"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 5
- Prefix prompt:
FÞlgende er flervalgsspÞrsmÄl (med svar).
- Base prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Svar: {label}
- Instruction-tuned prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Besvar fÞlgende spÞrsmÄl med 'a', 'b', 'c' eller 'd', og ikke noe annet.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset idioms-no
Unofficial: MMLU-no¶
This dataset is a machine translated version of the English MMLU dataset and features questions within 57 different topics, such as elementary mathematics, US history and law. The translation to Norwegian was conducted using the DeepL translation API.
The original full dataset consists of 269 / 1,410 / 13,200 samples for training, validation and testing, respectively. We use a 1,024 / 256 / 2,048 split for training, validation and testing, respectively (so 3,328 samples used in total). These splits are new and there can thus be some overlap between the original validation and test sets and our validation and test sets.
Here are a few examples from the training split:
{
"text": "Hvorfor er Mahavira en viktig person i jainatradisjonene?\nSvaralternativer:\na. Han er den siste av de asketiske profetene.\nb. Han er den fĂžrste av de asketiske profetene\nc. Han er den mest lĂŠrde av de asketiske profetene\nd. Han er den helligste av de asketiske profetene",
"label": "a"
}
{
"text": "En enfaset fullbroomformer kan drives i lastkommuteringsmodus hvis belastningen bestÄr av\nSvaralternativer:\na. RL.\nb. RLC underdempet.\nc. RLC overdempet.\nd. RLC kritisk dempet.",
"label": "b"
}
{
"text": "En professor, som var eneeier av en boligblokk, skrev et skjÞte med fÞlgende ordlyd: \"Jeg overdrar herved min boligblokk til min sÞnn og datter som leietakere i fellesskap.\" I skjÞtet, som var korrekt utferdiget, forbeholdt professoren seg en livsvarig eiendomsrett. Professoren fortalte deretter barna sine om overdragelsen og la den i familiehvelvet i biblioteket for oppbevaring. Deretter giftet sÞnnen seg med en lege. Professoren, som mislikte legen, utferdiget deretter et nytt skjÞte som han kalte \"et korreksjonsskjÞte\". I \"korreksjonsskjÞtet\" overfÞrte professoren bygÄrden \"til min sÞnn og datter som sameiere med overlevelsesrett.\" IfÞlge det nye skjÞtet forbeholdt professoren seg igjen livsvarig eiendomsrett. Begge barna aksepterte overdragelsen av \"korreksjonsskjÞtet.\" Et halvt Är senere dÞde sÞnnen, og etterlot seg legen som eneste arving. Eiendomsretten til boligblokken er i datterens og\nSvaralternativer:\na. datteren og legen som sameiere.\nb. datteren med forbehold om professorens livstidsarv.\nc. datteren og legen som sameiere, med forbehold om professorens livsarvinger.\nd. datteren og legen som sameiere med overlevelsesrett, med forbehold for professorens livsarvinger.",
"label": "c"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 5
- Prefix prompt:
FÞlgende er flervalgsspÞrsmÄl (med svar).
- Base prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Svar: {label}
- Instruction-tuned prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Besvar fÞlgende spÞrsmÄl med 'a', 'b', 'c' eller 'd', og ikke noe annet.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset mmlu-no
Unofficial: ARC-no¶
This dataset is a machine translated version of the English ARC dataset and features US grade-school science questions. The translation to Norwegian was conducted using the DeepL translation API.
The original full dataset consists of 1,110 / 297 / 1,170 samples for training, validation and testing, respectively. We use a 1,024 / 256 / 1,024 split for training, validation and testing, respectively (so 2,304 samples used in total). All new splits are subsets of the original splits.
Here are a few examples from the training split:
{
"text": "Hvorfor er det tryggere Ä se pÄ mÄnen enn pÄ solen?\nSvaralternativer:\na. MÄnen er mindre lyssterk.\nb. MÄnen er nÊrmere jorden.\nc. MÄnen skinner mest om natten.\nd. MÄnen er full bare én gang i mÄneden.",
"label": "a"
}
{
"text": "Hvilket av fÞlgende er et biprodukt av celleÄnding hos dyr?\nSvaralternativer:\na. oksygen\nb. varme\nc. sukker\nd. protein",
"label": "b"
}
{
"text": "Big Bang-teorien sier at universet\nSvaralternativer:\na. trekker seg sammen.\nb. ikke har noen begynnelse.\nc. startet som én enkelt masse.\nd. hele tiden danner hydrogen.",
"label": "c"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 5
- Prefix prompt:
FÞlgende er flervalgsspÞrsmÄl (med svar).
- Base prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Svar: {label}
- Instruction-tuned prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Besvar fÞlgende spÞrsmÄl med 'a', 'b', 'c' eller 'd', og ikke noe annet.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset arc-no
Common-sense Reasoning¶
NorCommonSenseQA¶
This dataset was published in this paper and is a manually translated and localised version of the English CommonSenseQA dataset. There are samples in both BokmÄl and Nynorsk, but with the vast majority being BokmÄl.
The original dataset contains 1,093 samples. We use a 128 / 128 / 787 split for training, validation and testing, respectively.
Here are a few examples from the training split:
{
"text": "Hvor er det sannsynlig at en fugl lager hjemmet sitt?\nSvaralternativer:\na. I skogen\nb. I et rede\nc. PĂ„ taket\nd. PĂ„ blader\ne. I himmelen",
"label": "a"
}
{
"text": "Hvis et hjem har et abonnoment, hva fÄr de sannsyneligvis hver dag i posten?\nSvaralternativer:\na. Delestykker\nb. En avis\nc. En gate\nd. En vaskemaskin\ne. Jordas overflate",
"label": "b"
}
{
"text": "NĂ„r du ikke klarer Ă„ gjĂžre noe ferdig, hva feilet du i da?\nSvaralternativer:\na. Ă
vinne\nb. Ă
bestĂ„\nc. Ă
fullfĂžr\nd. Ă
gjĂžre det bra\ne. Ă
lykkes",
"label": "c"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 5
- Prefix prompt:
FÞlgende er flervalgsspÞrsmÄl (med svar).
- Base prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
e. {option_e}
Svar: {label}
- Instruction-tuned prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
e. {option_e}
Besvar fÞlgende spÞrsmÄl med 'a', 'b', 'c', 'd' eller 'e', og ikke noe annet.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset nor-common-sense-qa
Unofficial: HellaSwag-no¶
This dataset is a machine translated version of the English HellaSwag dataset. The original dataset was based on both video descriptions from ActivityNet as well as how-to articles from WikiHow. The dataset was translated to Norwegian using the DeepL translation API.
The original full dataset consists of 9,310 samples. We use a 1,024 / 256 / 2,048 split for training, validation and testing, respectively (so 3,328 samples used in total).
Here are a few examples from the training split:
{
"text": "[header] Slik holder du deg kjÞlig og fÞler deg frisk om sommeren [title] Dusj hver dag. [step] Bruk en eksfolierende dusjsÄpe for Ä fjerne smuss. Sett vannet pÄ varmt i starten av dusjen (fordi det rengjÞr deg mer effektivt), men mot slutten av dusjen setter du vannet pÄ lunkent eller kjÞlig.\nSvaralternativer:\na. Dette senker kroppstemperaturen slik at du fÞler deg kjÞligere (og vÄkner opp om morgenen!). [SmÞr deg med fuktighetskrem rett etter at du har gÄtt ut av dusjen.\nb. PÄfÞr denne gelen pÄ svetten under armene eller pÄ kroppen. Tenk pÄ det som Ä spyle den ene armhulen med vann (du kan lage din egen dusjsÄpe med armene eller bena, og du kan vaske av deg litt med en gang).\nc. Alternativt kan du Äpne dÞren og la kjÞlig vann strÞmme gjennom det Äpne vinduet i minst en time. [Bruk en ansiktsmaske mens du dusjer.\nd. Vannet skal vÊre varmt nok til Ä skylle ut smuss og dÞd hud som henger over ansiktet. PÄfÞr kroppssÄpe (eller la den vÊre Äpen for lufting) pÄ hudoverflaten i korte riller.",
"label": "a"
}
{
"text": "En lÞper lÞper pÄ en bane foran en folkemengde. en mann\nSvaralternativer:\na. kaster en ball som hunden skal fange.\nb. snakker til kameraet.\nc. lÞper ikke nÄr han hopper ned i en sandkasse.\nd. gir en kort introduksjon fÞr han fortsetter og konkurrerer mot mannen i svart.",
"label": "b"
}
{
"text": "[header] Slik vet du om hunden din liker deg best [title] Legg merke til at hunden din fÞlger mye etter deg. [En mÄte Ä bevise at en hund liker deg best, er nÄr den er mye sammen med deg. SÄ hold Þye med om hunden din liker Ä vÊre i nÊrheten av deg.\nSvaralternativer:\na. [Hold Þye med eventuell fysisk atferd. [Et godt eksempel pÄ denne atferden er hvis den presser rumpa opp mot lÄret ditt og sjekker hva du har pÄ deg.\nb. [Se etter tegn pÄ at hunden din kan vÊre flÞrtende. [Et godt tegn pÄ at hunden din liker deg er at den klapper deg mye eller stirrer pÄ deg i intime Þyeblikk.\nc. [Finn ut om hunden din liker Ä leke med deg. [Hvis det er en hund som elsker leker, kan du leke med dem, og hvis den er veldig glad i Ä leke, sÄ liker den at du leker med den.\nd. Legg merke til at hunden din fÞlger deg rundt i huset hver dag nÄr du er ute og gÄr. Selv om du kanskje ikke har lyst til det, kan det Ä tilbringe mye tid sammen med en hund fÄ den til Ä fÞle seg komfortabel med deg.",
"label": "c"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 5
- Prefix prompt:
FÞlgende er flervalgsspÞrsmÄl (med svar).
- Base prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Svar: {label}
- Instruction-tuned prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
c. {option_c}
d. {option_d}
Besvar fÞlgende spÞrsmÄl med 'a', 'b', 'c' eller 'd', og ikke noe annet.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset hellaswag-no
Unofficial: Winogrande-no¶
This dataset was published in this paper and is a translated and filtered version of the English Winogrande dataset.
The original full dataset consists of 47 / 1,210 samples for training and testing, and we use 128 of the test samples for validation, resulting in a 47 / 128 / 1,085 split for training, validation and testing, respectively.
Here are a few examples from the training split:
{
"text": "Gjessene foretrekker Ä hekke pÄ markene i stedet for i skogene fordi i _ er rovdyr veldig synlige. Hva refererer det tomme _ til?\nSvaralternativer:\na. markene\nb. skogene",
"label": "a"
}
{
"text": "Planten tok opp for mye plass i urnen, fordi _ var stor. Hva refererer det tomme _ til?\nSvaralternativer:\na. plante\nb. urne",
"label": "a"
}
{
"text": "Lindsey elsket smaken av and, men Megan likte kylling bedre. _ bestilte kung pao kylling til middag. Hva refererer det tomme _ til?\nSvaralternativer:\na. Lindsey\nb. Megan",
"label": "b"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 5
- Prefix prompt:
FÞlgende er flervalgsspÞrsmÄl (med svar).
- Base prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
Svar: {label}
- Instruction-tuned prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
Besvar fÞlgende spÞrsmÄl med 'a' eller 'b', og ikke noe annet.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset winogrande-no
Summarisation¶
NoSammendrag¶
This dataset is a combination of the SNL and VG summarisation datasets as well as a translated version of the English XSum dataset, based on British BBC news articles. The SNL dataset is based on the Norwegian encyclopedia Store Norske Leksikon, while the VG dataset is based on the Norwegian articles from the newspaper VG. The translation of the XSum dataset was done using the NLLB model.
The original full dataset consists of 472,000 samples, and we use a 1,024 / 256 / 2,048 split for training, validation and testing, respectively (so 3,328 samples used in total).
Here are a few examples from the training split:
{
"text": "PĂ„ Akvariet i Bergen har pingvinene fĂ„tt et ekstra fristende sommertilbud denne uken. â Vi fikk en litt artig idĂ©, og bestemte oss for Ă„ gi pingvinene vĂ„re en slags «slush-is» i gĂ„r. Det ble til en morsom aktivisering for pingvinene, og det falt virkelig i god smak hos dem, sier dyrepasser Jannicke Johannessen. Hun forteller at de eldre pingvinene fĂžrst var litt skeptiske, og at det var de yngste som ledet an i isleken. â Ett- og toĂ„ringene var veldig interesserte da vi kom ut med isen, og hoppet opp pĂ„ den og storkoste seg. En av pingvinene ble faktisk liggende oppĂ„ isen helt til den smeltet, ler hun. Hun forteller at isen falt i sĂ„ god smak, at de skal gjenta suksessen lĂžrdag, slik at flere gjester i parken ogsĂ„ kan fĂ„ med seg aktiviteten.Selv om sommeren har satt flere varmerekorder i hele landet, forteller Johannessen at dyrene i Akvariet slettes ikke har lidd noen nĂžd. â Vi har California-sjĂžlĂžver, som overhodet ikke har hatt noen problemer med varmen. Tvert imot, de elsker Ă„ ligge Ă„ sole seg. Vi har ogsĂ„ europeiske otere, som takler klimaet godt, da det er dyr man finner naturlig i sĂžrlige deler av Europa. Dessuten er vi ekstremt heldige her pĂ„ Akvariet, og pumper opp nytt saltvann hele tiden, og dyrene har mange muligheter til Ă„ kjĂžle seg ned pĂ„. Hun gir imidlertid et viktig rĂ„d til dyreeiere som vil kjĂžle ned dyrene sine: â Jeg har fĂ„tt med meg at folk gir is som hundene kan spise for eksempel, og det er ikke akkurat et sjakktrekk. NĂ„r man kjĂžler ned dyrene fra innsiden samtidig som det er veldig varmt ute, tuller det med kroppstemperaturen. Kroppen jobber for Ă„ varme opp innsiden samtidig som de fĂ„r varme utenfra. Du gir dem egentlig et heteslag, sier hun. â Det beste er Ă„ kjĂžle dem ned pĂ„ utsiden. Dusj dem under «armhulene», eller generelt der de har tynn hud.OgsĂ„ i Tyskland har det vĂŠrt hĂžye temperaturer i sommer, og dyrepassere har mĂ„ttet ta grep for Ă„ avkjĂžle dyrene i varmen. I OsnabrĂŒck, nord i landet, ble det registrert rundt 35 varmegrader onsdag. For tapirene i dyrehagen ble maten strategisk servert i skyggen, slik at dyrene ikke blir solbrent. Dyrepasser Daniel Chirico bestemte seg dessuten for Ă„ spyle tapirene med en hageslange, for Ă„ kjĂžle dem ned ytterligere. â Spesielt de nordiske artene i dyreparken har merket hetebĂžlgen, og tilbringer mesteparten av dagen i skyggen, sier Tobias Klumpe, biolog i OsnabrĂŒck Zoo til den tyske avisen OsnabrĂŒcker Zeitung . SvartbjĂžrnene tar mer enn gjerne en kald dukkert i sola, samtidig som de nyter kalde forfriskninger med frukt og bĂŠr.I Finland har ogsĂ„ sommervarmen slĂ„tt inn for fullt. I Korkeasaari Zoo i Helsinki ble det torsdag registrert 30 varmegrader. LĂžsningen har blant annet vĂŠrt Ă„ installere en «regnskog» for kenguruene, mens papegĂžyene har fĂ„tt egne dusjer de kan bruke. BjĂžrnene har fĂ„tt iskald vannmelon, som de nyter i det kalde vannet, og tigerne fĂ„r frosne kaniner â sĂ„fremt de faktisk Ăžnsker Ă„ spise. â Appetitten deres blir mindre i varmen. For eksempel spiser hunnene i snitt bare annenhver dag, sier dyrepasser Jonne Stenroth til den finske avisen MTV . Ellers tilbringer tigrene mesteparten av dagen i skyggen mens de slapper av i bassenget, skriver avisen.",
"target_text": "Mens solen skinner og temperaturene er som hĂžyest, tar dyreparker rundt om i Europa i bruk kreative lĂžsninger for Ă„ holde dyrene avkjĂžlte."
}
{
"text": "Nick Corsellis, advokat for Carl Wood, sa at en \"innendÞrs mann\" mÄ ha vÊrt involvert i razzia, men hans klient manglet ekspertise til Ä vÊre den personen. Mr Wood og tre andre menn nekter Ä ha deltatt i £ 14m rÞveriet. Fire andre har allerede erklÊrt seg skyldig for deres roller i rÞveriet. \"Og dette er en av grunnene til at Mr. Wood ikke er skyldig. Hva tok han med seg til bordet?\" sa han. Mr. Corsellis sa at det ikke fulgte at hans klient var mannen som ble identifisert av anklagemyndigheten som \"Man F\" i CCTV-opptak av razzia. \"Male F var faktisk en spiller. En innsider, eller knyttet til innsiden, som var fullt kjent med det indre arbeidet i Hatton Garden Safe Deposit\". Mr. Wood manglet slik kunnskap og ville bare ha vÊrt i stand til Ä fungere som en \"generell hundekrop\", sa advokaten. Corsellis spurte juryen om profesjonelle kriminelle ville vÊrt forberedt pÄ Ä gi opp en del av sine millioner til en person som bare ville ha vÊrt et \"ekstrapar hender (EPH)\". Han kalte det \"ilogisk\" og \"utrolig\" at en slik person var involvert da \"kriminelle ikke er veldedig folk\". \"Men hvem ville spille Carl Wood - EPH? Tror du at Mr. Tom Hardy eller Mr. Vinnie Jones vil haste Ä ta rollen som... EPH?\" spurte han.",
"target_text": "En av mennene som er anklaget for Ă„ vĂŠre en del av Hatton Garden-raiden, kunne ikke ha vĂŠrt involvert fordi han manglet noen ferdigheter Ă„ tilby gjengen, har en domstol hĂžrt."
}
{
"text": "Verdenshjelpen forlot klubben i fjor pÄ grunn av arbeids- og studietilbud, pluss behovet for Ä komme seg fra en ryggskade. Manager Jamie Sherwood sa til klubbens nettside: \"Jeg er virkelig glad for Ä ha brakt Natalie tilbake til klubben. \"Hennes erfaring, lederskap og Äpenbare evne blir et utmerket tillegg til vÄr tropp for 2017\". Haigh la til: \"Etter skaden jeg fikk pÄ ryggen for nesten 15 mÄneder siden, trodde jeg aldri at jeg ville spille igjen, enn si pÄ dette nivÄet. \"Det er flott Ä vÊre tilbake i og rundt klubben - det er en ekte buzz etter den suksessen de oppnÄdde i fjor\".",
"target_text": "Yeovil Town Ladies har gjenforenet tidligere kaptein Natalie Haigh fĂžr damer Super League One klubbens fĂžrste sesong i toppklassen."
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 1
- Prefix prompt:
Her fĂžlger nyhetsartikler med tilhĂžrende sammendrag.
- Base prompt template:
Nyhetsartikkel: {text}
Sammendrag: {target_text}
- Instruction-tuned prompt template:
Nyhetsartikkel: {text}
Skriv et sammendrag av den ovennevnte artikkelen.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset no-sammendrag
Unofficial: NorGLM Multi Sum¶
This dataset was released in this paper and features a manually annotated summarisation dataset based on Norwegian news articles.
The original dataset contains 467 samples, which we split into 147 / 64 / 256 samples for training, validation and test, respectively.
Here are a few examples from the training split:
{
"text": " En sel i England ble fanget i plast. Det kunne gĂ„tt galt. Hver dag blir ogsĂ„ dyr i Norge fanget i plast. Et vondt syn mĂžtte nylig dyrevernere pĂ„ en strand i England. Der lĂ„ en sel som hadde tuklet seg inn i plast. Det kunne gĂ„tt veldig galt.â Det var tydelig at selen hadde det vondt, forteller en kvinne som sĂ„ selen pĂ„ stranden, til kanalen BBC.Men dyrlegene fra den britiske dyrevernsorganisasjonen BDMLR kom heldigvis i tide. De klarte Ă„ fri selen fra plasten. Selen ble sluppet tilbake i sjĂžen.Heldigvis ble ikke selen skadet denne gangen, forklarte dyrevernsorganisasjonen til BBC.Men mange dyr er ikke sĂ„ heldige nĂ„r de blir fanget i plast. Dyr setter seg fast i plast over hele verden. Norske sjĂždyr setter seg fast i plast hver eneste dag, forteller Per-Erik Schulze. Han jobber i Naturvernforbundet og er ekspert pĂ„ plast og forurensing i havet. â Mange av dyrene stĂ„r fast i mange dager eller mĂ„neder uten Ă„ slippe lĂžs. Det er helt grusomt, sier Schulze.Han forteller at disse dyrene ofte setter seg fast i plast: SjĂžfuglerFiskSelerSmĂ„hvalerHummerSkilpadderDet er ogsĂ„ dyr pĂ„ land som setter seg fast i plast, for eksempel sauer og reinsdyr. Hvert Ă„r havner over Ă„tte millioner tonn plast i havet, ifĂžlge Verdens naturfond (WWF). Det meste synker til havbunnen, resten skyller inn pĂ„ strender eller flyter pĂ„ havoverflaten.Det er farlig for dyr som lever i og rundt havet, fordi de kan sette seg fast i plasten eller fĂ„ den i magen.Hva skjer med dyrene som setter seg fast i plast?â Det er det stĂžrste dyreplageriet i verden. Det er veldig vondt Ă„ hekte seg fast. Mange dĂžr kanskje ikke av plasten, men av sult, fordi de ikke kommer seg lĂžs sĂ„ de kan dra og spise, sier han.Derfor er det viktig ikke Ă„ kaste plast som forsĂžpler naturen, mener Schulze.â En fin tanke er at hver plastbit vi rydder opp, kanskje kan redde et dyr. For det finnes ogsĂ„ en god nyhet: De siste Ă„rene har mange ryddet sĂžppel i naturen og langs kysten i Norge. Har det hjulpet? â Ja, det har vĂŠrt en kjempe-ryddedugnad i Norge de siste fem Ă„rene. Noen steder er det sĂ„ rent nĂ„ at det er vanskelig Ă„ finne noe plast. Det er et godt tegn, sier Schulze.",
"target_text": " En sel i England som var fanget i plast ble reddet av dyrevernere. Dette er en vanlig situasjon, bÄde i Norge og andre steder i verden, da mange dyr setter seg fast og lider lenge fordi de ikke kan komme seg lÞs. Per-Erik Schulze, en ekspert fra Naturvernforbundet, oppfordrer folk til Ä fortsette ryddearbeidet for Ä minimere risikoen for dyr Ä komme til skade assosiert med plastforsÞpling. Han bekrefter at ryddedugnadene i Norge har vÊrt en suksess."
}
{
"text": " Det drar seg til mot sommer, ferietid, og ikke minst helg. Usikker pĂ„ hva du skal vie den til? Her har du et lite knippe velmente tips.Denne guiden gjelder fra fredag 10. juni til sĂžndag 12. juni.Fredag og lĂžrdag er det duket for folkefest og musikkbonanza pĂ„ Viking stadion i JĂ„ttĂ„vĂ„gen.Anledningen er to konserter fra det folkekjĂŠre Stavangerbandet Mods, som er tilbake igjen pĂ„ arenaen hvor de i 2012 og i 2017 spilte foran flere titalls tusen elleville fans. OgsĂ„ Kvelertak er med pĂ„ Ă„ innramme en meget sterk musikkhelg i regionen. PĂ„ fredag gĂ„r de nemlig opp pĂ„ scenen pĂ„ Folken i Stavanger, og skal by pĂ„ de herligste toner med bĂ„de hardrock og metall. OgsĂ„ i utelivets verden skjer det ting i helgen. Fredag kveld gjĂžr et nytt nattklubb- og cocktailbar-konsept sitt inntog i Stavanger nĂ„r LouLou Ă„pner dĂžrene i de gamle Hot-lokalene i Skagen. â Vi har sett at Stavanger manglet en annen og kanskje litt mer eksklusiv plass, hvor man kan feire bursdager og andre store begivenheter, sa daglig leder i Rekom, Frederik Mygind til Byas i forrige uke.OgsĂ„ pĂ„ Show Bar, nysatsingen til duoen Dennis Poppe og Ăyvind SĂžrensen, blir det Ă„pning til helgen. «Ein liden (ein) pre-opening i morgen (lĂžrdag) og sĂžndag pĂ„ Show Bar! Sees kl. 20:00», skriver Poppe pĂ„ sin Instagram-konto. Etter seieren borte mot Sverige sist sĂžndag, er det en revansjelysten «söta bror» som gjester Ullevaal kommende sĂžndag. Flere rogalendinger figurerer i viktige roller pĂ„ landslaget, med Erling Braut Haaland, Veton Berisha, Kristian Thorstvedt og Birger Meling som navnene. Kampen kan sees pĂ„ flere utesteder i Stavanger, men kan ogsĂ„ nytes fra sofaen fra klokken 20:45. I det Aftenbladet omtaler som «superdagene», med en hel rekke arrangementer den kommende uken, finner flere av de sted denne helgen. Det 91 kilometer lange sykkellĂžpet, NordsjĂžrittet, fra Egersund til Sandnes gĂ„r av stabelen lĂžrdag, og kan la svettekjertlene fĂ„ fri utfoldelse. Rittet sĂ„ dagens lys tilbake i 1998 og er et samarbeid mellom flere lokale sykkelklubber. Og pĂ„ Sola blir det moro for bĂ„de store og smĂ„ nĂ„r Sola Airshow 2022, flystevnet som har vist fram gamle og nye luftmaskiner i en Ă„rrekke, holdes pĂ„ lĂžrdagen og sĂžndagen. Er du derimot mer opptatt av folkelivet, sĂ„ kan enten Tanangerdagene, eller Solafestivalen vĂŠre for deg. I Sola kulturhus er det pĂ„ fredag og lĂžrdag duket for ungdomsfestival.Arrangementet er gratis, for de mellom 13 og 20 Ă„r, og byr blant annet pĂ„ musikk fra den norske rapperen Hkeem, samt Stavanger-bandet Kriminell Kunst. Og et lite stykke unna, fra onsdag denne uken og fram til og med sĂžndag, blir det folkeliv i Tananger, nĂ„r Tanagerdagene gĂ„r av stabelen. Arrangementet holdes i regi av Lions Club Tananger, og lover fem dager fulle av aktiviteter for familier, barn, ungdom og voksne. â Her er noe for alle og mye for mange. Hjertelig velkommen, skriver arrangĂžren pĂ„ Facebook-arrangementet sitt. Fra 10. til 12. juni holder fem kunstnere pop up-utstilling i Pedersgata.Kunstnerne det er snakk om er ragnhild.kristine, pryl.art, hwks.art, corneliussen.art og Rosa Ottestad.Det hele finner sted i Pedersgata 43, og det er ventet flere besĂžkende til arrangementet. Utstillingen Ă„pner kl. 18 pĂ„ fredag, og holder Ă„pent gjennom helga. Vet du bedre enn oss hva skjer neste helg? Send en e-post til helga@byas.no!",
"target_text": " Artikkelen handler om hvilke arrangementer som skal holdes i perioden fra 10. juni til 12. juni. Blant arrangementene er konserter med bandene Mods og Kvelertak, landskamp i fotball pÄ Ullevaal, og flystevnet Sola Airshow 2022 pÄ Sola der det skal vises fram gamle og nye luftmaskiner. I tillegg arrangeres Tanangerdagene og Solafestivalen."
}
{
"text": " Regjeringen foreslĂ„r Ă„ Ă„pne nye omrĂ„der for oppdrettsnĂŠringen, men med strenge miljĂžkrav. â Gir betydelige muligheter for Ă„ Ăžke produksjonen, sier fiskeriministeren.NĂŠrings- og fiskeridepartementet foreslĂ„r nĂ„ en ny tillatelsesordning for oppdrett med miljĂžkrav.Det fĂžrste Ă„ret kan det tildeles tillatelser pĂ„ maksimalt 15.000 tonn biomasse (fisk). Hver enkelt sĂžker kan maksimalt fĂ„ tildelt ti tillatelser, og det vil stilles strenge miljĂžkrav til sĂžkerne, heter det i meldingen fra departementet.â Dagens produksjon i Ă„pne merder vil fortsatt vĂŠre grunnstammen i norsk oppdrett. I tillegg har vi lagt til rette for landbasert oppdrett og havbruk til havs. Med denne ordningen peker vi ut en ny retning som gir oppdrettsnĂŠringen mulighet til Ă„ ta i bruk nye arealer langs kysten, sier fiskeri- og sjĂžmatminister Odd Emil Ingebrigtsen (H).Til sammenligning ble det produsert rundt 1,4 millioner tonn laks i Norge i 2019, ifĂžlge SSB.Tillatelsene i den nye miljĂžteknologiordningen kommer i tillegg til veksten som blir tilbudt pĂ„ ordinĂŠr mĂ„te gjennom trafikklyssystemet.â Samlet sett gir dette norsk havbruksnĂŠring betydelige muligheter for Ă„ Ăžke produksjonen fremover, sier ministeren.Forslaget innebĂŠrer fĂžlgende miljĂžkrav: Null utslipp av egg og frittsvĂžmmende stadier av lakselus, minimum 60 prosent oppsamling av slam, samt krav til rĂžmningssikkerhet.Prisen for tillatelsene vil bli satt med utgangspunkt i auksjonsprisene som er oppnĂ„dd i forbindelse med ordinĂŠre kapasitetsjusteringer, men med et rimelig fradrag.â HavbruksnĂŠringen skaper store verdier for Norge. Men videre vekst mĂ„ skje innenfor bĂŠrekraftige rammer. Hensynet til natur generelt, og villaksen spesielt, er av avgjĂžrende betydning, sier klima- og miljĂžminister Sveinung Rotevatn (V).Til tross for bedring pĂ„ viktige omrĂ„der, er antallet norsk laks i havet mer enn halvert siden 1980-tallet, ifĂžlge Vitenskapelig rĂ„d for lakseforvaltning.Det er flere grunner til det, ogsĂ„ overfiske, men rĂ„det slĂ„r fast at rĂžmt oppdrettslaks og lakselus nĂ„ er de stĂžrste truslene mot villaks.Forslaget skal pĂ„ kort tid ut pĂ„ hĂžring.E24 skrev tidligere at siste sitat i saken var fra Ingebrigtsen, mens det egentlig var fra Rotevatn. E24 beklager og har nĂ„ rettet feilen.",
"target_text": " Regjeringen foreslÄr en ny tillatelsesordning for oppdrett med strenge miljÞkrav for Ä muliggjÞre bÊrekraftig vekst i havbruksnÊringen. Denne ordningen vil Äpne nye omrÄder for oppdrett, tillate hver sÞker Ä fÄ maksimalt ti tillatelser, og krever null utslipp av egg og frittsvÞmmende stadier av lakselus, minimum 60 prosent oppsamling av slam, samt krav til rÞmningssikkerhet. Dette skal gi nÊringen mulighet til Ä Þke produksjonen pÄ bÊrekraftig mÄte."
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 1
- Prefix prompt:
Her fĂžlger nyhetsartikler med tilhĂžrende sammendrag.
- Base prompt template:
Nyhetsartikkel: {text}
Sammendrag: {target_text}
- Instruction-tuned prompt template:
Nyhetsartikkel: {text}
Skriv et sammendrag av den ovennevnte artikkelen.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset norglm-multi-sum
Unofficial: Schibsted-no¶
This dataset was released here and features summaries of news articles from Schibsted Medias Norwegian newsrooms.
The original dataset contains 1,240 / 347 / 374 samples for training, validation and testing, respectively. We use these splits as-is.
Here are a few examples from the training split:
{
"text": "Klubblegenden med innrĂžmmelse under VAR-debatten: â Vanskelig Ă„ stĂ„ her : VAR-opprĂžret tok en knusende seier i Trondheim. Til og med styremedlem Ola By Rise mĂ„tte innrĂžmme at det var mange gode argumenter imot videodĂžmmingen. Den gamle keeperhelten talte RBK-styrets sak for VAR sammen med medstyremedlem Tore Reginiussen: â Det er en veldig vanskelig sak. Det er ikke to VAR-tilhengere som stĂ„r her, sa en engasjert By Rise fra talerstolen. VAR-debatten hadde kommet til Rosenborgs medlemmer torsdag, som skulle stemme for at Rosenborg aktivt skulle arbeide for Ă„ fjerne VAR eller ikke. 489 stemte for Ă„ avvikle VAR. 157 stemte for Ă„ beholde VAR. Stemmene ble lest opp til enorm applaus fra salen. Forslaget om at RBK-styret skulle fĂ„ «utrede ulike modeller for Ă„ fĂ„ kapital inn i klubben» ble ogsĂ„ stemt ned med god margin. â Medlemmene har definitivt makta i Rosenborg og de bruker den. Dette er et gedigent nederlag for det sittende styret og leder Cecilie Gotaas Johnsen, sier Adresseavisens kommentator Birger LĂžfaldli til VG. â SĂŠrlig investorsaken tror jeg er tung Ă„ svelge, der det forelĂžpig kun var snakk om en utredning. Jeg er spent pĂ„ hvordan Gotaas Johnsen vil reagere pĂ„ dette og hvordan hun vurderer arbeidsbetingelsene det kommende Ă„ret, sier LĂžfaldli. VAR-debatten var den som tok lengst tid: â Jeg har forstĂ„else for klubbens posisjon og forstĂ„r at mĂ„ten oppleves som uvanlig detaljstyrende. Men for mange er dette en ekstraordinĂŠr sak. Det er viktig at styret forstĂ„r: VAR mĂ„ ikke forbedres, VAR mĂ„ fjernes! sa forslagsstiller Ole Christian GullvĂ„g. â Talelista begynner Ă„ bli lang, var meldingen fra ordstyrer etter at et par stykker hadde snakket sin side i VAR-saken. Styremedlem By Rise argumenterte med at det ville bli vanskelig Ă„ «sette tannkremen tilbake pĂ„ tuben». Forslagsstiller GullvĂ„g svarte: â For oss oppleves det som at noen har sprĂžytet tannkrem pĂ„ stua midt under fredagstacoen. Vi har ikke bedt om det, vil ikke ha det. Ola By Rise har tidligere vĂŠrt ute pĂ„ Twitter og vĂŠrt kritisk til VAR. Han innrĂžmmet ogsĂ„ sin tvil rundt temaet. â Det er vanskelig Ă„ stĂ„ her. Man mĂ„ ikke stĂ„ hver kamp pĂ„ Ăvre Ăst for Ă„ reagere pĂ„ hvordan VAR praktiseres i dag. SĂ„ er det ikke sikkert den blir god nok. Involveringen av supporterne burde definitivt blitt bedre. Men det er ikke sikkert det er verktĂžyet som er problemet, men gjennomfĂžringen, sa By Rise. Han og Reginiussen listet opp bĂ„de negative og positive sider ved VAR, og pekte som flere andre klubber pĂ„ det potensielle Ăžkonomiske tapet ved Ă„ fjerne VAR. Styret argumenterte for at Rosenborg skulle vĂŠre en kritisk meningsbĂŠrer rundt videodĂžmming. Et titalls medlemmer tok ordet og sa seg svĂŠrt uenige, og til slutt var det forslaget fra medlemmene som vant frem. RBK-medlem Emil AlmĂ„s var forslagsstiller sammen med GullvĂ„rg. Han sier fĂžlgende til VG: â Det vi har fĂ„tt til i norsk toppfotball de siste dagene er en seier for fotballen og en seier for medlemsdemokratiet. Ved Ă„ takke nei til VAR, har norske supportere startet et jordskred, som kommer til Ă„ rase gjennom fotballeuropa i Ă„rene som kommer! Den dagen VAR er historie, skal jeg med stolthet si at jeg, og mange andre norske fotballsupportere var med pĂ„ Ă„ trille de fĂžrste steinene nedover dalsiden, sier AlmĂ„s. PS. En rĂžrt Rune Bratseth mottok tittelen som ĂŠresmedlem i Rosenborg, etter en lang karriere som spiller, sportssjef og styremedlem. - Det er veldig spesielt for meg, sa Bratseth. ",
"target_text": "489 RBK-medlemmer stemte for Ă„ avvikle VAR ved et mĂžte torsdag, med 157 mot Styremedlem Ola By Rise innrĂžmmet gode argumenter mot videodĂžmming, men argumenterte for at Rosenborg skulle vĂŠre en kritisk stemme imot. RBK-medlem Emil AlmĂ„s hevder \"norske supportere starter et jordskred\" mot VAR i Europa Medlemmene ga ogsĂ„ sitt nei til at RBK-styret skulle fĂ„ «utrede ulike modeller for Ă„ fĂ„ kapital inn i klubben». â Et gedigent nederlag for det sittende styret, mener Adresseavisens kommentator Birger LĂžfaldli "
}
{
"text": "Gazas befolkning sultes med vilje, sier FN-ekspert: Krigen har Ăždelagt matproduksjonen. Samtidig slippes det ikke inn nok nĂždhjelp. Israel driver en aktiv politikk for Ă„ sulte ut Gazas befolkning, mener FNs spesialrapportĂžr. Israel har som mĂ„l Ă„ begrense Gazas sivilbefolkning tilgang til mat. Det hevder FNs spesialrapportĂžr for retten til mat, Michael Fakhri, til The Guardian. â Det finnes ingen grunn til Ă„ med vilje stoppe leveringen av humanitĂŠr hjelp eller Ăždelegger smĂ„ fiskebĂ„ter, drivhus og fruktĂ„kere, bortsett fra Ă„ nekte folk tilgang til mat, sier Fakhri til den britiske avisen. Han mener at Israel med dette gjĂžr seg skyldig i bĂ„de krigsforbrytelser og folkemord. Jan Egeland: â Fullstendig galskap Sentrale israelske politikere er flere ganger blitt anklaget for Ă„ ha brukt retorikk som oppfordrer til folkemord. Dette ble blant annet lagt til grunn da SĂžr-Afrika klaget Israel inn til ICJ. â Som en menneskerettighetsekspert ved FN mener jeg at dette nĂ„ er en folkemord-situasjon, understreker Fakhri. Fakhri er ikke den eneste som har advart om konsekvensene av hungersnĂžden i Gaza. En FN-rapport konkluderte nylig: Flyktninghjelpens generalsekretĂŠr, Jan Egeland, reiste tirsdag inn i Gaza. Han beskriver rystende scener med desperate mennesker som gjĂžr alt i sin makt for Ă„ kare til seg mat. â Jeg er fullstendig sjokkert over forholdene her. Folk slĂ„ss som ville og gale over madrasser og sekker med mat, sier Egeland til VG. â Det er fullstendig galskap at verden har latt en befolkning bestĂ„ende av stort sett helt uskyldige kvinner og barn bli utsatt for bombardement og utsulting siden midten av oktober. Hevder Israel trosser FN-domstol Situasjonen er ikke blitt bedre de siste ukene. Det sier bistandsorganisasjoner. Det til tross for at Den internasjonale domstolen (ICJ), FNs viktigste domstol, for Ă©n mĂ„ned siden bestemte at Israel mĂ„ gjĂžre alt i sin makt for Ă„ sĂžrge for Ă„ stoppe et folkemord og sĂžrge for at palestinere har tilgang til bistand. Human Rights Watch (HRW) og Amnesty International pĂ„peker at det slippes inn 30 prosent fĂŠrre lastebiler med nĂždhjelp hver dag nĂ„ sammenlignet med fĂžr ICJs pĂ„legg 26. januar. I februar slapp det inn halvparten sĂ„ mye nĂždhjelp i Gaza som mĂ„neden fĂžr, ifĂžlge FNs organisasjon for palestinske flyktninger (Unrwa). â Den israelske regjeringen sulter 2,4 millioner palestinere i Gaza. Det sier Omar Shakir, som er lederen for HRWs virksomhet i Israel og Palestina. â Den israelske regjeringen har ganske enkelt oversett domstolens pĂ„legg, fĂžyer han til. Tirsdag redegjorde Ramesh Rajasingham ved FNs kontor for koordinering av humanitĂŠr innsats (UNOCHA) om situasjonen for FNs sikkerhetsrĂ„d. Han advarte om at jordbruket i Gaza vil kollapse innen mai hvis situasjonen ikke blir bedre, og hvis det ikke blir pause i krigshandlingene. â Vi understreker derfor nok en gang vĂ„rt krav om en vĂ„penhvile, sa han. USA blokkerte i februar enda en gang en resolusjon i SikkerhetsrĂ„det om vĂ„penhvile. Begrunnelsen var at resolusjonen kunne Ăždelegge forhandlinger om vĂ„penhvile og fangeutveksling som pĂ„gĂ„r mellom Egypt, Israel og Qatar. â Hvis ingenting skjer, frykter vi at storskala sult i Gaza nesten er uunngĂ„elig, og det vil fĂžre til mange flere ofre, sa Rajasingham til SikkerhetsrĂ„det.",
"target_text": "FN mener Israel prÞver Ä sulte ut befolkningen pÄ Gazastripen. MÄlrettede angrep hindrer matproduksjon og levering av nÞdhjelp. Akutt underernÊring truer hele befolkningen. Barn og kvinner i Nord-Gaza og Rafah er mest utsatt. Israel overser FN-domstolens pÄlegg om Ä gi palestinere tilgang til bistand. Hjelpeorganisasjoner ser mindre nÞdhjelp komme inn."
}
{
"text": "Marokkanske og albanske mafianettverk dominerer. Svenskene blir en stadig stĂžrre trussel.: Flere er bygd pĂ„ lojalitet til familie og klan, ifĂžlge ny rapport fra Kripos. Om kort tid legger politiet frem sin trusselvurdering. Der vil Politi-Norge peke pĂ„ de stĂžrste truslene mot det norske samfunnet. En av truslene som vil bli viet mye plass, er organiserte kriminelle nettverk. I Norge er det rundt hundre slike nettverk. Kripos mener politiet har kapasitet til Ă„ fĂžlge med pĂ„ 40 av dem. Nettverkene smugler og selger enorme mengder narkotika. De stĂ„r bak skyteepisoder, eksplosjoner, menneskesmugling og bedragerier. MĂ„let er profitt. Midlene er vold og hard indre justis. Noen av de mektigste nettverkene er bygd pĂ„ lojalitet til familie og klan. NĂ„ letter Kripos pĂ„ slĂžret. For fĂžrste gang gĂ„r politiet ut med en egen rapport om nettverkene som dominerer i den kriminelle underverdenen: I rapporten trekker Kripos frem fem store trusler: 1. Marokkanske narkonettverk En av de aller stĂžrste truslene er marokkanske narkonettverk. â De er utrolig sentrale, ikke bare i Norge og Norden, sier Eivind Borge fra Kripos. Norskmarokkanere dukker ogsĂ„ opp i etterforskninger i andre europeiske land. Aftenposten har tidligere omtalt Zakariya Rahali, som har vĂŠrt pĂ„ rĂžmmen siden 2017. Rahali er pekt ut som lederen av Norges stĂžrste narkonettverk. 2. Albanske narkonettverk Etter marokkanerne, er det albanske nettverk som utgjĂžr den stĂžrste trusselen. Disse regnes for Ă„ vĂŠre blant de stĂžrste nettverkene som driver med kokain i hele Europa. 3. Svenske narkonettverk Borges skrekkscenario er at Norge kommer dit Sverige er i dag. Der har gjengkrigen herjet og deler av samfunnet er i ferd med Ă„ bli infiltrert av kriminelle. I Norge har samtlige politidistrikt stĂžtt pĂ„ svenske kriminelle nettverk. Og trusselen er Ăžkende, vurderer Kripos. 4. Litauiske kriminelle nettverk For Ă„ frakte narkotika, trengs det logistikk. For Ă„ gjĂžre dette, tar mange kriminelle i bruk litauiske nettverk. 5. Norge som transittland I fjor opplevde Europa en «kokaintsunami». Enorme mengder kokain ble tatt av politi og tollere, ogsĂ„ i Norge. Men prisene gikk ikke opp. Et tegn pĂ„ at store mengder kokain er i omlĂžp. I flere Ă„r har havnene i Rotterdam og Antwerpen vĂŠrt stedet hvor kokain er blitt smuglet inn til Europa. Men der har myndighetene kastet seg rundt. Dermed mĂ„ de kriminelle se seg om etter nye havner for Ă„ fĂ„ det hvite pulveret til kundene. De store beslagene i fjor, kan peke mot at Norge i stĂžrre grad er i ferd med Ă„ bli et av disse stedene. Enn sĂ„ lenge er det for tidlig Ă„ konkludere om Norge er blitt en del av kokainruten til Europa, mener Borge og Ole JĂžrgen Arvesen, avdelingsleder med ansvar for etterretning i Kripos. GĂ„r sammen med kartellene Hvordan kan Kripos vĂŠre sĂ„ sikre i sin sak? Mye kommer fra pĂ„gĂ„ende etterforskninger, men de siste Ă„rene har de ogsĂ„ fĂ„tt et unikt innblikk i hvordan de kriminelle jobber og samarbeider. De har fĂ„tt meldinger og bilder fra Encrochat, Sky ECC og Anom. Det har ledet til flere store saker, men likevel er trusselen fra de kriminelle nettverkene blitt stĂžrre. â Den er betydelig og Ăžkende for hele Europa, ogsĂ„ Norge, sier Arvesen. Nettverkene er blitt mer profesjonelle og samarbeider mer med kriminelle i andre land. â Vi ser tydelig at norske nettverk har direkte kontakt med karteller i SĂžr-Amerika, sier Eivind Borge fra Kripos. Han sier bakmennene de jobber for Ă„ ta, ikke lar seg stoppe med forebygging. Det krever mye etterforskning og samarbeid med politi i andre land.",
"target_text": "For fÞrste gang gÄr politiet ut med en egen rapport om kriminelle nettverk. Rapporten peker pÄ fem store trusler: marokkanske og albanske narkonettverk, svenske narkonettverk, litauiske kriminelle nettverk og at Norge blir et transittland for kokain. Nettverkene i Norge er blitt mer profesjonelle, har direkte kontakt med karteller i SÞr-Amerika. Dette krever mer etterforskning og internasjonalt samarbeid."
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 1
- Prefix prompt:
Her fĂžlger nyhetsartikler med tilhĂžrende sammendrag.
- Base prompt template:
Nyhetsartikkel: {text}
Sammendrag: {target_text}
- Instruction-tuned prompt template:
Nyhetsartikkel: {text}
Skriv et sammendrag av den ovennevnte artikkelen.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset schibsted-no
Unofficial: VG Front Title¶
This dataset was published here and features front-page titles of news articles from Schibsted Media's Norwegian newsroom, VG.
Here are a few examples from the training split:
{
"article_id": "jabrGq",
"text": "Donald Trump og co klarte ikke endre valgresultatet med sine pĂ„stander om juks i 2020-valget, men nĂ„ mener mange at de legger grunnarbeidet for Ă„ kunne klare det i 2024 â dersom «nĂždvendig». Fremdeles er det uvisst om Donald Trump kommer til Ă„ stille til presidentvalg igjen i 2024, men dersom han gjĂžr det â og taper en gang til â tror de flere eksperter at han igjen vil hevde at valget har blitt stjĂ„let fra ham. Slik han gjorde â uten Ă„ legge frem bevis for pĂ„standene om juks â etter valget i november 2020. Noe som to mĂ„neder senere endte med stormingen av Kongressen. â Skulle han stille og tape i 2024 sĂ„ vil han aldri innrĂžmme det, sier Civita-rĂ„dgiver og USA-ekspert Eirik LĂžkke, som pĂ„peker at han bĂ„de i 2016 â da han vant â og i 2020 hevdet valget var rigget. Da Trump tapte i 2020 forsĂžkte han legge press pĂ„ en rekke ulike personer i hĂ„p om Ă„ snu tapet til seier. Som da han ringte den republikanske administrasjonsministeren i Georgia, Brad Raffensperger, og ba ham «finne» 11.780 ekstra stemmer for Trump. Men Trumps forsĂžk lyktes ikke. Raffensperger bĂžyde ikke etter for Trumps krav, men sĂžrget for at den med flest stemmer ble erklĂŠrt som vinner I Georgia. Han, og flere andre bĂ„de i Georgia og i andre vippestater der Trump hevdet juks hadde pĂ„gĂ„tt, var lojale til grunnloven, demokratiet og folkets vilje. Ikke til sitt eget parti og sin egen kandidat. For det ble de fĂžrst belĂžnnet av Trump-lojalister med utskjelling og drapstrusler. Og nĂ„ med kampanjer for Ă„ fĂ„ dem fjernet fra sine posisjoner. â Mye stĂžrre sjanse I disse dager pĂ„gĂ„r nemlig et intenst arbeid i kulissene der Trump og hans allierte jobber med Ă„ fĂ„ installert hĂ„ndplukkede lojalister i de rollene ute i delstatene som har makt til Ă„ godkjenne, eller avvise, valgresultater. Lykkes de med Ă„ fĂ„ valgt inn «sine» folk i de viktige vippestatene vil det dermed vĂŠre langt flere der ute som vil vĂŠre villige til Ă„ gjĂžre det Trump ber dem om. â Da er det grunn til Ă„ tro at Trump har mye stĂžrre sjanse til Ă„ lykkes med Ă„ endre et valgresultat, sier LĂžkke. USA-eksperten minner om at presidentvalget i USA i realiteten er 50 forskjellige valg â alle med egne regler. Han mener det er sĂŠrlig to forhold som kan gjĂžre det enklere for Trump Ă„ lykkes i 2024: â Det fĂžrste forholdet er en endring av hvem som kan godkjenne stemmer avgitt i enkelte delstater. I Georiga er det nĂ„ flyttet fra de lokale valgdistriktene til en sentral kommisjon utnevnt av delstatens republikanske flertall. Det innebĂŠrer for eksempel at den kommisjonen har makt til Ă„ underkjenne stemmer i storbyen Atlanta, hvor demokratene henter mesteparten av sine stemmer, forklarer LĂžkke, som legger til at dette ogsĂ„ har skjedd i andre delstater. â Den andre forholdet er at Trump i stor grad forsĂžker Ă„ fĂ„ lojale folk valgt i avgjĂžrende posisjoner hva gjelder Ă„ godkjenne valgene i viktige delstater, fortsetter han. Hadde disse personene vĂŠrt i posisjon i avgjĂŠrende vippestater som Georgia, Arizona og Michigan i 2020, sĂ„ kunne det blitt mye mer dramatisk enn det ble, mener LĂžkke. StĂžttet Trump - fĂ„r hans stĂžtte IfĂžlge Washington Post har rundt en tredjedel av de 390 republikanerne som rundt i landet har vist interesse for Ă„ stille til valg til ulike delstatsposisjoner i det kommende mellomvalget offentlig stĂžttet at partiet bĂžr granske valgresultatet fra 2020, bagatellisert angrepet pĂ„ Kongressen for et Ă„r siden, eller beint fram stilt spĂžrsmĂ„l ved legitimiteten av Joe Bidens seier i 2020. Dette inkluderer 10 kandidater som stiller til den viktige rollen som administrasjonsminister i delstatene, en posisjon som i mange stater har ansvaret for Ă„ godkjenne valgresultater. Mark Finchem, for eksempel, stiller som valg til den rollen i Arizona. I en twittermelding i hĂžst krevde han arrestasjoner og skrev at Bidens seier i hans delstat bĂžr erklĂŠres ugyldig. Trump har denne gang gitt stĂžtteerklĂŠringer til flere som stiller til slike valg. Noe han ikke drev med fĂžr han selv tapte et valg",
"target_text": "NÄ fÄr Trump-lojalister mer makt: «Ringer i alle alarmklokker»"
}
{
"article_id": "kRVOgA",
"text": "En pensjonert mann ble liggende dĂžd i ni Ă„r fĂžr noen fant ham. â I en storby som Oslo er det dessverre mange som lever anonyme og ofte ensomme liv, sier sosialbyrĂ„den. â Det er veldig trist Ă„ fĂ„ hĂžre om enkeltmennesker som dĂžr alene uten pĂ„rĂžrende som etterlyser dem, skriver sosialbyrĂ„d i Oslo Rina Mariann Hansen (Ap) i en e-post til VG. LĂžrdag publiserte NRK en sak om en eldre mann som ble liggende dĂžd i leiligheten sin i hele ni Ă„r fĂžr han ble funnet. Mannen var pensjonert og bodde i en blokk Ăžst i Oslo. Mannen dĂžde i 2011 â av naturlige Ă„rsaker. I de ni Ă„rene som gikk trodde naboer ifĂžlge NRK at han var pĂ„ en institusjon eller at han hadde flyttet. Mannen er ikke alene om Ă„ ha blitt liggende uoppdaget i lang tid etter sin dĂžd. IfĂžlge NRK lĂ„ i fjor 27 mennesker i Oslo, Asker og BĂŠrum dĂžde i over syv dager fĂžr de ble funnet. I 2019 gjaldt det 32 mennesker â blant dem en kvinne som ble funnet dĂžd i sin leilighet pĂ„ GrĂŒnerlĂžkka i Oslo. Da hadde hun ligget der i fem mĂ„neder. â I en storby som Oslo er det dessverre mange som lever anonyme og ofte ensomme liv, noen ganger selvvalgt. Det travle storbylivet gjĂžr kanskje at vi som medmennesker lettere glemmer Ă„ bry oss, sier sosialbyrĂ„d Hansen. â Jeg tror vi mĂ„ bry oss mer i hverdagen, bry oss om hvem som er naboene vĂ„re og hvordan de har det. Kanskje spĂžrre litt oftere hvordan det gĂ„r med dem. Mellom 2013 og 2017 var det 140 mennesker i Oslo som lĂ„ dĂžde i mer enn en uke, ifĂžlge en oversikt Aftenposten lagde i 2018. SosialbyrĂ„den mener saken viser at alle osloborgere mĂ„ bidra til Ă„ gjĂžre hovedstaden til en by der folk fĂžler tilhĂžrighet og fellesskap. â Vi kan alle gjĂžre vĂ„rt for at Oslo skal bli en varmere og mer inkluderende by. â Pandemien har lĂŠrt oss noe om hva mangel pĂ„ menneskelig kontakt i hverdagslige settinger gjĂžr med oss. Kanskje de erfaringene vi gjĂžr oss nĂ„ under pandemien gjĂžr at vi som samfunn evner Ă„ ta bedre vare pĂ„ hverandre. ByrĂ„d for helse, eldre og innbyggertjenester i Oslo, Robert Steen (Ap), hadde ikke anledning til Ă„ kommentere saken lĂžrdag. ",
"target_text": "Funnet dÞd etter ni Är: - Veldig trist"
}
{
"article_id": "MLe9mK",
"text": "Han var Russlands rikeste. NĂ„ advarer den tidligere oligarken Mikhail Khodorkovskij (58) mot Ă„ tro at Putin vil stoppe ved Ukrainas grenser. Mikhail Khodorkovskij (58) var Russlands rikeste oligark, og posisjonen som leder for landets stĂžrste oljeselskap ga han direkte tilgang til president Putin. Det tok brĂ„tt slutt da Khodorkovskij snakket hĂžyt om korrupsjon i Russland. Oligarken sonet ti Ă„r i fengsel for det som menneskerettsorganisasjoner betegner som en straff for Ă„ ha kritisert Kreml. Mikhael Khodorkovskij er av dem som vet best hva Putin er kapabel til. Da VG snakker med ham pĂ„ videolinje fra russerens selvpĂ„lagte eksil i London, har han et klart budskap om Russlands krig i Ukraina: Ikke tro at du kan forhandle med Putin. â Til den dag i dag ser jeg ingen andre utveier enn Ă„ vise Putin tydelig at han taper. Frem til Putin forsvinner, kommer Europa til Ă„ ha store og seriĂžse problemer, sier han. Vestens misforstĂ„else Khodorkovskij var pĂ„ 90-og starten av 2000-tallet kjent som bĂ„de kompromisslĂžs og kynisk. Som mange andre oligarker har han blitt kritisert for skruppellĂžst Ă„ ha utnyttet den sĂ„rbare Ăžkonomiske situasjonen Russland var i ved Sovjetunionens sammenbrudd. Han som nĂ„ er en 58 Ă„r gammel forretningsmann, har siden han slapp ut av fengsel i 2013, jobbet fra London med Ă„ forsĂžke Ă„ endre styret i Russland gjennom organisasjonen Ă
pent Russland. Khodorkovskij mener Vesten har misforstĂ„tt noe vesentlig om Putins krig. â Dere tenker at Putin fortsatt ikke har krysset over landegrensene til de vestlige landene. Men for Putin, har han allerede det. Det er krystallklart fra Putins propaganda at han allerede er i krig med Nato og USA, mener Khodorkovskij. â Valget dere nĂ„ mĂ„ ta er enten Ă„ beseire Putin pĂ„ Ukrainas territorium, eller sĂ„ mĂ„ dere kjempe mot han pĂ„ territoriet til et Nato-land. Da stĂ„r vi overfor noe mye verre, sier han til VG. Vestens «alvorlige feil» Khodorkovskij kjenner godt maktens innerste ganger i hjemlandet, fordi han eide oljeprodusenten Yukos, noe som gjorde ham til Russlands rikeste i 2003 med en formue pĂ„ svimlende 120 milliarder kroner. Olje er ogsĂ„ stikkordet nĂ„r den tidligere oligarken snakker om den alvorlige feilen han mener vestlige land gjorde for ti Ă„r siden, nemlig Ă„ gjĂžre seg avhengig av russisk olje og gass. â Allerede da burde vestlige land sett hvilken vei Putin tok Russland, og startet en omlegging til Ă„ sikre seg energi fra andre kilder. Vel, bedre sent enn aldri. I dag betaler Vesten for Ă„ ha vĂŠrt sen, mener russeren. Vesten er nĂ„ avhengig av et autoritĂŠrt regime, og Putin bruker dette som et pressmiddel, oppsummerer regimekritikeren til VG. Hvis Europa sluttet helt Ă„ kjĂžpe olje og gass fra Russland, hvor fort ville landets Ăžkonomi kollapse, ble Khodorkovskij nylig spurt i programmet Hard Talk. â Hvis Putin mĂ„ omdirigere olje og gass til det asiatiske markedet, vil han miste halvparten av inntekten. Det er halvparten av statsbudsjettet. Ville han klart Ă„ fortsette krigen under slike omstendigheter? Det er vanskelig for meg Ă„ si, jeg er ingen militĂŠrekspert. Men det ville etter mitt syn vĂŠrt et alvorlig tilbakeslag, svarte Khodorkovskij. «Ble selv lurt» av Putin Et videoopptak av president Putins umiddelbare reaksjon pĂ„ korrupsjonsanklagene Khodokovskij kom med i 2003, er brukt i dokumentarfilmen Citizen K fra 2019. Der vises Putins umiddelbare, sammenbitte reaksjon pĂ„ anklagene. Ti Ă„r i fengsel i Sibir stoppet altsĂ„ likevel ikke Khodorkovskij. Den tidligere oligarken sier til VG at han ikke vil refse vestligere statsledere for ikke Ă„ ha sett hvilken fare Putin var, fordi han « ble selv lurt» da han i Ă„rene fra slutten av 90-tallet til 2003 mĂžtte presidenten mange ganger. â Putin er dyktig til Ă„ tilpasse seg til det folk Ăžnsker Ă„ se i han. Det vet jeg fordi jeg selv opplevde det. Jeg ville gjerne se en ung, demokratisk leder av det nye Russland, og han demonstrerte med glede dette. Har han endret seg? Jeg tror vel egentlig at han bare var god til Ă„ late som, sier han til VG",
"target_text": "Eks-oligark: - Ser ingen andre utveier"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 1
- Prefix prompt:
Her fĂžlger nyhetsartikler med tilhĂžrende titler.
- Base prompt template:
Nyhetsartikkel: {text}
Tittel: {target_text}
- Instruction-tuned prompt template:
Nyhetsartikkel: {text}
Skriv en tittel for den ovennevnte artikkelen.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset vg-front-title
Unofficial: Personal Sum¶
This dataset was released here and contains human annotated summaries that reflect individual user preferences.
The original dataset contains 1,099 summaries based on 441 unique articles. The dataset has been restructured into 441 samples, where each sample represents a unique article paired with all of its corresponding summaries (1 or more). The dataset has been split such that we have 121 / 64 / 256 samples for training, validation and testing, respectively.
Here are a few examples from the training split:
{
"text": "I en ny bok forteller Abid Rajas sĂžster Abida Raja (49) at hun over lengre tid levde i et voldelig forhold. I en pressemelding avviser eksmannen anklagene. â Min klient Ăžnsker Ă„ pĂ„peke at han nekter straffeskyld for partnervold og\nvoldtektsanklager. Han vedkjenner at ekteskapet har hatt sine utfordringer, og at de derfor skilte seg i 2015, skriver eksmannens advokat Javeed H. Shah i en pressemelding. I boken «Frihetens Ăyeblikk», beskriver Raja at eksmannen hennes var voldelig, og at hun flere ganger forsĂžkte Ă„ unnslippe mannen. I boken skriver forfatter HĂ„kon F. HĂžydal:«De siste tjue Ă„rene hadde vĂŠrt en kamp mot seg selv: Hun Ăžnsket Ă„ gĂ„ fra mannen. Men hun mĂ„tte bli. PĂ„ grunn av barna, og pĂ„ grunn av familien, pĂ„ grunn av frykten for fattigdom og skam. NĂ„ hadde hun verken barna, penger eller hus.»VG har tidligere vĂŠrt i kontakt med Abida Rajas eksmann i forbindelse med bokutgivelsen, som tirsdag ikke hadde lest boken.â Jeg er i utlandet og har ikke lest boken, sĂ„ kan ikke kommentere uten Ă„ lese det, skriver han i en SMS til VG.I boka skriver forfatteren at Abida etter stort press fra familien, skal ha mĂžtt Ă©n av ektemannkandidatene, en 23 Ă„r gammel inngiftet onkel i Pakistan. Hun var 18 Ă„r og skulle gĂ„tt i andre klasse pĂ„ videregĂ„ende hjemme i Norge.«Abida husker ikke om hun sa ja. Men hun sa heller ikke nei. Hun ville bare bort», heter det i boken.Onsdag svarer eksmannen via sin advokat, at han har levd i god tro om at Abida giftet seg av fri vilje slik hun selv uttrykte ovenfor han. â Derfor er opplysningene om tvangsekteskap noe han ble kjent med fĂžrst i 2020. Boken kommer ett Ă„r etter at venstrepolitiker og tidligere statsrĂ„d Abid Raja kom med sin bok\xa0«Min skyld». Boken er skrevet av VG-journalist HĂ„kon F. HĂžydal og ble lansert tirsdag morgen\xa0etter mye hemmelighold. VG har ikke hatt noe med utgivelsen Ă„ gjĂžre.",
"target_text": ["I en ny bok forteller Abid Rajas sÞster Abida Raja om hennes erfaringer med et voldelig ekteskap, hvor hun beskriver flere forsÞk pÄ Ä unnslippe. Eksmannen avviser anklagene og hevder at han levde i god tro om at ekteskapet var av fri vilje, noe han fÞrst ble klar over i 2020.",
"Abida Raja beskriver i en ny bok et voldelig forhold med sin eksmann, som avviser anklagene om partnervold og voldtektsanklager. Boken avslÞrer ogsÄ at Abida ble presset til Ä mÞte en ektemannkandidat i en tvangssituasjon, noe eksmannen hevder han ikke var klar over fÞr i 2020.",
"I boken «Frihetens Þyeblikk» forteller forfatteren HÄkon F. HÞydal at Rajas eksmann var voldelig og hun Þnsket Ä forlate ham. Hun ble vÊrende fordi hun var redd for barnas lidelser, redd for fattigdom og hun skammet seg."]
}
{
"text": "Flere lakseaksjer falt igjen tungt, dagen etter at skatteforslag ga bĂžrsras for sjĂžmatselskaper. Samtidig steg Norwegian etter anbefaling fra storbank.Det Ble en noe vinglete dag pĂ„ Oslo BĂžrs torsdag.Etter en positiv start vendte BĂžrsen snuten nedover i tidlig handel, fĂžr den hentet seg inn igjen til forsiktig oppgang omtrent halvveis ut i handelsdagen. Utover ettermiddagen snudde BĂžrsen sĂ„ nedover igjen.Hovedindeksen endte til slutt dagen ned 1,58 prosent.Nedgangen tiltok den siste timen med handel, samtidig som Wall Street falt kraftig.Oljeprisen steg solid gjennom gĂ„rsdagen, og handles rundt Ă©n dollar hĂžyere enn da BĂžrsen stengte onsdag. Et fat NordsjĂžolje (brent spot) koster ved stengetid torsdag 88,4 dollar, ned rundt 0,9 prosentsiden midnatt.Oljeselskapene Equinor og Aker BP falt i overkant av Ă©n prosent, mens VĂ„r Energi endte ned 3,82 prosent.Onsdag falt Hovedindeksen 2,76 prosent etter at lakseselskapene fikk gjennomgĂ„ etter regjeringens foreslĂ„tte grunnrenteskatt pĂ„ havbruk. Verst gikk det for Salmar som stupte 30 prosent, samtidig som LerĂžy Seafood falt 27,5 prosent. Torsdag fortsetter nedgangen for lakseaksjene. SjĂžmatindeksen endte ned 5,05 prosent.Slik sĂ„ det ut for lakseaksjene ved stengetid (utvikling onsdag i parentes): Salmar falt 1,05 prosent (stupte 30,3 prosent)Grieg Seafood falt 2,75 prosent (falt 26,6 prosent)Mowi falt 3,15 prosent (falt 18,9 prosent) LerĂžy Seafood falt 8,10 prosent (raste 27,5 prosent)Austevoll Seafood falt 6,28 prosent (falt 21,7 prosentNorway Royal Salmon falt 8,94 prosent (endte ned 22,9 prosent)Bakkafrost-aksjen falt samtidig 12,83 prosent.Selskapet har virksomhet pĂ„ FĂŠrĂžyene og understreket onsdag at de ikke pĂ„virkes av det nye norske skatteforslaget. Samtidig understreket de at det arbeides med et forslag om justeringer av skattesatsen pĂ„ FĂŠrĂžyene.I USA peker pilene solid nedover pĂ„ bĂžrsene torsdag ettermiddag.Det er kraftig nedgang pĂ„ Wall Street, der den brede S&P 500-indeksen faller godt over to prosent. Teknologiindeksen Nasdaq faller samtidig mer enn tre prosent.I Europa er det ogsĂ„ bred, kraftig nedgang pĂ„ de viktigste bĂžrsene. London-bĂžrsen, Frankfurt-bĂžrsen og Paris-bĂžrsen er alle ned i overkant av to prosent rundt stengetid i Oslo.Storbanken HSBC har gjenopptatt dekning pĂ„ flyselskapet Norwegian, ifĂžlge Bloomberg. Banken anbefaler kjĂžp og har satt et kursmĂ„l pĂ„ 14,50 kroner. Dermed ser banken for seg en oppside pĂ„ hele 119 prosent i aksjen, skriver nyhetsbyrĂ„et. Norwegian-aksjen steg 6,81 prosent.â Nye Norwegian er en annen forretning enn den fĂžr pandemien, som har omstrukturert operasjonelt og Ăžkonomisk, skriver HSBC i analysen.â Den nye ledelsen har en solid strategi, en enkel og kostnadseffektiv\nforretningsmodell med en enkelt type fly, et sterkt fokus pĂ„ sine nĂžkkelmarkeder i Norden og en solid balanse og likviditet, alt innenfor et gunstig konkurranselandskap som bĂžr tillate ny NAS Ă„ ta markedsandeler fra sine konkurrenter, heter det videre i analysen.Storbanken begrunner ogsĂ„ sin nye dekning pĂ„ flyselskapet ved at dets konkurrenter venter mye motvind og ny etterspĂžrsel for Norwegian kan komme ut av det. I tillegg nevnes Norges sikkerhetsnett rundt hĂžye energi- og strĂžmpriser.- Mens Europa stĂ„r overfor hĂžy inflasjon og lav forbrukertillit, har Norge betydelig lysere utsikter med sine omfattende energiressurser, statlig finansiering og hĂžy inntekt per innbygger.HSBC viser ogsĂ„ til hĂžy reiseetterspĂžrsel blant nordmenn.Fornybarselskapet Scatec er i fokus i forbindelse med at selskapet har kommet med nye mĂ„lsetninger. Selskapet vil investere 10 milliarder kroner av egenkapitalen i nye kraftverk frem mot 2027. Investeringene har som mĂ„l Ă„ utvide kapasiteten med 1,5 gigawatt hvert Ă„r i perioden. Scatec-aksjen endte dagen ned 2,93 prosentXXL er samtidig blant bĂžrstaperne torsdag. Aksjen til sportsbutikk-kjeden falt 11,66 prosent.",
"target_text": ["Lakseaksjer opplever fortsatt betydelig nedgang pÄ Oslo BÞrs etter regjeringens foreslÄtte grunnrenteskatt pÄ havbruk. Hovedindeksen endte ned 1,58 prosent, og sjÞmatindeksen falt ytterligere 5,05 prosent. Samtidig steg Norwegian-aksjen etter anbefaling fra HSBC, som gjenopptok dekning pÄ selskapet og anbefalte kjÞp med et kursmÄl pÄ 14,50 kroner, med en forventet oppside pÄ 119 prosent."]
}
{
"text": "(Minnesota Wild â St. Louis Blues 4â6) Mats Zuccarello (34) var svĂŠrt kritisk til seg selv og lagkameratene i Minnesota Wild etter nattens tap mot St. Louis Blues i 23 minusgrader foran 38.000 tilskuere.â Jeg har egentlig ikke ord. Det er pinlig nĂ„r du har 40.000 mennesker som kommer og fryser rĂŠva av seg, og sĂ„ spiller vi sĂ„nn, sa Zuccarello pĂ„ pressekonferansen etter «Winter Classic»-oppgjĂžret pĂ„ Target Field â et baseballstadion i Minneapolis. FĂžr siste periode ledet Blues 6â2, og Zuccarello beskriver de to fĂžrste periodene som at de ble «lett utspilt» av Blues. Zuccarello hadde Ă©n assist â da Ryan Hartman scoret lagets tredje mĂ„l . Wild reduserte to ganger i siste periode og fastsatte sluttresultatet til 4â6. 34-Ă„ringen mener det ikke nytter Ă„ forklare tapet med kulden, vanskelige forhold og det faktum at de ikke har spilt kamp siden 20. desember: â Det er ingen unnskyldninger ... Det er kaldt for begge lag, isen er humpete for begge lag. Vi spilte ikke smart hockey som vi har gjort i store deler av sesongen. Det var Wilds femte strake tap i en sesong der Zuccarello og laget jevnt over har levert meget bra. â Dessverre skjedde det pĂ„ en stor kveld som dette. Folk forlater hjemmene sine i kulden for Ă„ stĂžtte oss, og sĂ„ serverer vi dem dette. Vi har skuffet oss selv og alle andre. Det var pĂ„ forhĂ„nd varslet sprengkulde, og mĂ„lingene viste 23 minusgrader. Zuccarello beskriver opplevelsen slik:â Jeg var skikkelig kald under oppvarmingen, men nĂ„r kampen starter slĂ„r adrenalinet inn. Men jeg tror aldri jeg har vĂŠrt sĂ„ kald i hele mitt liv fĂžr sisteperioden da vi lĂ„ under 6â2, eller hva det var. Det var ingen god fĂžlelse. â Det store bildet nĂ„ er at vi har fem strake tap, og vi mĂ„ finne tilbake til mĂ„ten Ă„ vinne pĂ„ og hvordan vi skal spille som et lag, sier Zuccarello. Zuccarello har scoret Ă„tte mĂ„l og lagt 17 mĂ„lgivende pasninger i lĂžpet av 25 kamper denne sesongen. Det vil si ett mĂ„lpoeng per kamp i snitt. I sine beste mĂ„lpoengsesonger for New York Rangers â 2013/14, 2015/16 og 2016/17 â oppnĂ„dde han henholdsvis 59 mĂ„lpoeng pĂ„ 77 kamper, 61 mĂ„lpoeng pĂ„ 81 kamper og 59 pĂ„ 80 kamper.PS! Natt til fredag spiller Minnesota Wild borte mot Boston Bruins. To dager senere er det hjemmekamp mot Washington Capitals.",
"target_text": ["Minnesota Wild led et nederlag mot St. Louis Blues under ekstreme vÊrforhold pÄ Target Field. Mats Zuccarello uttrykte sin skuffelse over lagets ytelse foran 38 000 tilskuere, og tilskrev tapet til dÄrlig spill heller enn kulden. Til tross for Zuccarellos bidrag med en assist, endte Wild med sitt femte strake tap, noe som fÞrte til et press for Ä finne tilbake til seiersformen fÞr kommende kamper mot Boston Bruins og Washington Capitals.",
"Det er ingen unnskyldninger for Wilds femte strake tap, til tross for at bÄde Zuccarello og resten av laget generelt har spilt bra denne sesongen. Forholdene var like for begge lag, men laget spilte ikke smart hockey slik de har gjort tidligere i sesongen."]
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 1
- Prefix prompt:
Her fĂžlger nyhetsartikler med tilhĂžrende sammendrag.
- Base prompt template:
Nyhetsartikkel: {text}
Sammendrag: {target_text}
- Instruction-tuned prompt template:
Nyhetsartikkel: {text}
Skriv et sammendrag av den ovennevnte artikkelen.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset personal-sum
Unofficial: NorSumm-nb¶
This dataset was released in this paper and features manually annotated summaries of Norwegian news articles written in BokmÄl. The articles are sourced from the Norwegian event extraction dataset EDEN, and each article has three manually annotated summaries. We use the first summary as the target.
The original dataset contains 30 development and 33 test articles. We use 8 articles from the development set as the train split, and combine the remaining development articles with all 33 test articles as the test split. Each sample contains a single reference summary (the first annotated summary).
Here are a few examples from the training split:
{
"text": "DĂždssyke Hannah fĂ„r oppfylt sitt siste Ăžnske likevel | Forsikringsselskapet lar henne dra til Disneyland. FĂ„r dĂž hjemme: Kreftsyke Hannah Jones (13) overbeviste britiske helsemyndigheter om Ă„ fĂ„ slippe en hjertetransplantasjon. Hun vil heller tilbringe de siste mĂ„nedene av sitt liv hjemme hos familien. Liker Disney: Hannah var i Euro Disney for flere Ă„r siden. NĂ„ fĂ„r hun oppfylt drĂžmmen om Ă„ dra til Disneyland i USA. Overbeviste med sin modenhet: Hannah Jones fikk selv velge at hun ikke skal fĂ„ et nytt hjerte. Historien om Hannah har fĂ„tt stor oppmerksomhet i britiske medier, blant annet Sky News. DĂždssyke Hannah Jones (13) har sagt nei til et nytt hjerte. Hun orker ikke en ny operasjon, og vil heller dĂž hjemme. Hannah Ăžnsker Ă„ fĂ„ tilbringe sine siste dager hjemme sammen med foreldrene og sĂžsknene Oliver (11), Lucy (10) og Phoebe (4). Samtidig har hun en siste drĂžm: Ă
fÄ reise til Disneyland i Orlando i USA. Fikk ikke reiseforsikring | 13-Äringenes foreldre forsÞkte Ä fÄ henne med pÄ en gruppetur med 40 andre syke eller funksjonshemmede barn, arrangert av veldedige Caudwell Children. Alle barna fikk reiseforsikring. Men ikke Hannah, selv om familien prÞvde hos en rekke selskaper. Det sÄ ut til at det aldri skulle bli noe av turen. Men nÄ har et selskap meldt seg og sagt seg villig til Ä forsikre 13-Äringen, melder Sky News. - Jeg er henrykt og overveldet, sier hun til TV-kanalen. - En uke vekk fra rutinene pÄ sykehuset vil vÊre en fin avkobling for meg og familien min, vi vil vÊre som en vanlig familie en liten stund, sier hun. - Gleder oss | Navnet pÄ selskapet som oppfyller Hannahs drÞm er ikke kjent. Hannahs far, Andrew Jones, taker nÄ alle som har hjulpet familien. - Vi er veldig glade for at vi fÄr til dette, og gleder oss til Ä se smilet hennes nÄr vi kommer dit, sier han. Hannah Jones fikk konstatert leukemi da hun var fem Är, og har gÄtt pÄ tunge medisiner i flere Är. Til slutt fÞrte medisinene til en alvorlig hjertefeil, og Hannah har i dag et hull i hjertet. Da legene foreslo en hjertetransplantasjon svarte jenta nei. Hun ville heller fÄ lov Ä avslutte livet sammen med sine aller nÊrmeste, noe som kan bety at hun bare har seks mÄneder igjen Ä leve.",
"target_text": "Hannah Jones (13) fikk konstatert leukemi da hun var fem Är gammel og har gÄtt pÄ tunge medisiner i flere Är. \n\n Til slutt fÞrte medisinene til en alvorlig hjertefeil, og Hanna har i dag et hull i hjerte. \n\n Hannah har en siste drÞm om Ä dra til Disneyland i USA. \n\n Foreldrene prÞvde Ä fÄ henne med pÄ en gruppetur med 40 andre syke eller funksjonshemmede barn, arrangert av Caudwell Children. \n\n Alle barna fikk reiseforsikring bortsett fra Hannah og det sÄ ut som at hun ikke kunne reise likevel. \n\n Men nÄ har et selskap sagt seg villig til Ä forsikre Hannah slik at hun og familien kan dra likevel, melder Sky News."
}
{
"text": "Tvisynt ombudsmann | Stappfulle esker. Forsvarsskrift. Ombudsmannen | Borten-biografi. Det blir for snevert nÄr Harald Berntsen bruker tittelen «Staurberaren» pÄ den fÞrste store biografien om tidligere statsminister Per Borten. Ingen av Per Bortens uttalelser gjennom mer enn 50 Är som lokalpolitiker, stortingsrepresentant, statsminister og politisk kÄrkall er blitt sÄ legendarisk som da han ved avskjeden som statsminister i 1971 sammenlignet det Ä lede en koalisjonsregjering med Ä bÊre sprikende staur. Men uttalelsen passet bedre pÄ situasjonen enn pÄ personen som kom med den. Per Borten ble valgt som statsminister etter den borgerlige valgseieren i 1965 fordi flertallet i HÞyres stortingsgruppe mente at han kunne bli den mest samlende regjeringssjefen. Det varte bare noen fÄ Är. Da Regjeringen gikk i gradvis indre opplÞsning etter den nye valgseieren i 1969, var statsministerens uforutsigbare og ustrukturerte arbeidsstil en del av forklaringen, men langt fra hele. Den altoverskyggende Ärsak var at de politiske motsetningene mellom regjeringspartiene, fÞrst og fremst i EF-saken, tÊret sÄ hardt pÄ tillitsforholdet partiene imellom at samarbeidet ikke lenger var liv laga. Bortens tabbe med Ä skjule for sin regjering at han hadde vist fortrolige dokumenter til ledelsen i Folkebevegelsen mot norsk medlemskap i EEC, avgjorde bare tidspunktet for og omstendighetene rundt et regjeringssammenbrudd som ville ha kommet uansett. Historikeren Harald Berntsen konstaterer med rette at toneangivende kretser pÄ begge sider i den uforsonlige EF-kampen mente deres sak var best tjent med at Borten-regjeringen gikk av. En koalisjon dannet som et samlende svar pÄ et langvarig og maktfullkomment Ap-styre, mÞtte sin skjebne fordi det etter hvert ble tyngre saker som splittet partiene enn som bandt dem sammen. Berntsen har pÄtatt seg en bÄde viktig og vanskelig oppgave. Ikke bare har det vÊrt et problem, som han selv skriver i forordet, Ä bli klok pÄ Borten. PÄ toppen av dette kom de metodiske utfordringer. De fleste andre ledende norske politikere i de fÞrste etterkrigstiÄrene, som Einar Gerhardsen, John Lyng, Trygve Bratteli og KÄre Willoch, har skrevet memoarer som danner gode utgangspunkt for andres kritiske granskning. Det var en fremmed tanke for Borten. Statsministeren i Norges fÞrste brede og varige borgerlige koalisjonsregjering etterlot seg timelange radiointervjuer med tidligere Dagsnytt-redaktÞr Per BÞhn og 70-80 stappfulle esker med usorterte papirer pÄ loft og i kjeller hjemme pÄ gÄrden i FlÄ. De fleste som kom i kontakt med Borten i hans tid som aktiv politiker, eller i den lange kÄrkallsperioden, skjÞnner hvorfor det ble slik. Med fÄ unntak var Borten ingen handlingens mann. Og evnen til systematikk var ingen fremtredende egenskap ved hans personlighet. Han var mer opptatt av Ä lytte, filosofere og diskutere enn av Ä bidra til sitt eget ettermÊle i form av en arbeidskrevende skriftlig fremstilling. Hans fascinerende blanding av intellektuell nysgjerrighet, bondeful folkelighet og politisk uforutsigbarhet gjorde ham til en spennende samtalepartner bÄde for politisk interesserte og folk flest. Berntsens stÞrste fortjeneste ligger i systematiseringen av det enorme kildematerialet. Men det at han i sÄ stor grad har mÄttet begynne pÄ bar bakke, er kanskje ogsÄ en del av forklaringen pÄ at deler av boken bÊrer mer preg av forsvarsskrift for en utradisjonell politiker enn biografi med kritisk avstand. Av og til kan leseren fÄ inntrykk av at Berntsen analyserer Borten litt for mye i lys av sin egen politiske fortid pÄ venstresiden. Et eksempel pÄ det er forfatterens overraskelse over Bortens sterke engasjement mot de mange ulovlige streikene det siste Äret av hans statsministertid. Et annet er hans forsÞk pÄ Ä omtale Borten som en sannere sosialdemokrat enn Aps egne ledere. At Borten som statsminister viderefÞrte og videreutviklet viktige sosiale reformer som Folketrygden, viser mer om verdifellesskapet over de partipolitiske skillelinjene i 1960-Ärenes Norge enn om Bortens eget politiske stÄsted. Fra statsministertiden nevner Berntsen offentlighetsloven og oppreisningen til krigsseilerne som viktige saker for Borten. Og fra Ärene etterpÄ fremstÄr kampen mot politisk overvÄking som den tydeligste delen av hans samfunnsvirke. Engasjementet i disse tre sakene representerer kanskje den mest konsekvente linje i Per Bortens motsetningsfylte politiske liv. Han fremsto som en ombudsmann for enkeltmennesker overfor et maktapparat det i egenskap av statsminister i fem og et halvt Är falt i hans lodd Ä vÊre den fremste representant for.",
"target_text": "Det blir for snevert nÄr Harald Berntsen bruker tittelen «Staurberaren» pÄ den fÞrste store biografien om tidligere statsminister Per Borten. \n\n Tittelen refererer til da Borten ved avskjeden som statsminister i 1971 sammenlignet det Ä lede en koalisjonsregjering med Ä bÊre sprikende staur. \n\n Berntsen skriver selv i forordet at det har vÊrt et problem og metodiske utfordringer med Ä bli klok pÄ Borten da Borten ikke hadde skrevet en memoar. \n\n Det at Berntsen i sÄ stor grad har mÄttet starte pÄ bar bakke er kanskje en del av forklaringen pÄ at deler av boken bÊrer preg av forsvarsskrift for en utradisjonell politiker enn biografi med kritisk avstand."
}
{
"text": "Tvisynt ombudsmann | Stappfulle esker. Forsvarsskrift. Ombudsmannen | Borten-biografi. Det blir for snevert nÄr Harald Berntsen bruker tittelen «Staurberaren» pÄ den fÞrste store biografien om tidligere statsminister Per Borten. Ingen av Per Bortens uttalelser gjennom mer enn 50 Är som lokalpolitiker, stortingsrepresentant, statsminister og politisk kÄrkall er blitt sÄ legendarisk som da han ved avskjeden som statsminister i 1971 sammenlignet det Ä lede en koalisjonsregjering med Ä bÊre sprikende staur. Men uttalelsen passet bedre pÄ situasjonen enn pÄ personen som kom med den. Per Borten ble valgt som statsminister etter den borgerlige valgseieren i 1965 fordi flertallet i HÞyres stortingsgruppe mente at han kunne bli den mest samlende regjeringssjefen. Det varte bare noen fÄ Är. Da Regjeringen gikk i gradvis indre opplÞsning etter den nye valgseieren i 1969, var statsministerens uforutsigbare og ustrukturerte arbeidsstil en del av forklaringen, men langt fra hele. Den altoverskyggende Ärsak var at de politiske motsetningene mellom regjeringspartiene, fÞrst og fremst i EF-saken, tÊret sÄ hardt pÄ tillitsforholdet partiene imellom at samarbeidet ikke lenger var liv laga. Bortens tabbe med Ä skjule for sin regjering at han hadde vist fortrolige dokumenter til ledelsen i Folkebevegelsen mot norsk medlemskap i EEC, avgjorde bare tidspunktet for og omstendighetene rundt et regjeringssammenbrudd som ville ha kommet uansett. Historikeren Harald Berntsen konstaterer med rette at toneangivende kretser pÄ begge sider i den uforsonlige EF-kampen mente deres sak var best tjent med at Borten-regjeringen gikk av. En koalisjon dannet som et samlende svar pÄ et langvarig og maktfullkomment Ap-styre, mÞtte sin skjebne fordi det etter hvert ble tyngre saker som splittet partiene enn som bandt dem sammen. Berntsen har pÄtatt seg en bÄde viktig og vanskelig oppgave. Ikke bare har det vÊrt et problem, som han selv skriver i forordet, Ä bli klok pÄ Borten. PÄ toppen av dette kom de metodiske utfordringer. De fleste andre ledende norske politikere i de fÞrste etterkrigstiÄrene, som Einar Gerhardsen, John Lyng, Trygve Bratteli og KÄre Willoch, har skrevet memoarer som danner gode utgangspunkt for andres kritiske granskning. Det var en fremmed tanke for Borten. Statsministeren i Norges fÞrste brede og varige borgerlige koalisjonsregjering etterlot seg timelange radiointervjuer med tidligere Dagsnytt-redaktÞr Per BÞhn og 70-80 stappfulle esker med usorterte papirer pÄ loft og i kjeller hjemme pÄ gÄrden i FlÄ. De fleste som kom i kontakt med Borten i hans tid som aktiv politiker, eller i den lange kÄrkallsperioden, skjÞnner hvorfor det ble slik. Med fÄ unntak var Borten ingen handlingens mann. Og evnen til systematikk var ingen fremtredende egenskap ved hans personlighet. Han var mer opptatt av Ä lytte, filosofere og diskutere enn av Ä bidra til sitt eget ettermÊle i form av en arbeidskrevende skriftlig fremstilling. Hans fascinerende blanding av intellektuell nysgjerrighet, bondeful folkelighet og politisk uforutsigbarhet gjorde ham til en spennende samtalepartner bÄde for politisk interesserte og folk flest. Berntsens stÞrste fortjeneste ligger i systematiseringen av det enorme kildematerialet. Men det at han i sÄ stor grad har mÄttet begynne pÄ bar bakke, er kanskje ogsÄ en del av forklaringen pÄ at deler av boken bÊrer mer preg av forsvarsskrift for en utradisjonell politiker enn biografi med kritisk avstand. Av og til kan leseren fÄ inntrykk av at Berntsen analyserer Borten litt for mye i lys av sin egen politiske fortid pÄ venstresiden. Et eksempel pÄ det er forfatterens overraskelse over Bortens sterke engasjement mot de mange ulovlige streikene det siste Äret av hans statsministertid. Et annet er hans forsÞk pÄ Ä omtale Borten som en sannere sosialdemokrat enn Aps egne ledere. At Borten som statsminister viderefÞrte og videreutviklet viktige sosiale reformer som Folketrygden, viser mer om verdifellesskapet over de partipolitiske skillelinjene i 1960-Ärenes Norge enn om Bortens eget politiske stÄsted. Fra statsministertiden nevner Berntsen offentlighetsloven og oppreisningen til krigsseilerne som viktige saker for Borten. Og fra Ärene etterpÄ fremstÄr kampen mot politisk overvÄking som den tydeligste delen av hans samfunnsvirke. Engasjementet i disse tre sakene representerer kanskje den mest konsekvente linje i Per Bortens motsetningsfylte politiske liv. Han fremsto som en ombudsmann for enkeltmennesker overfor et maktapparat det i egenskap av statsminister i fem og et halvt Är falt i hans lodd Ä vÊre den fremste representant for.",
"target_text": "Det blir for snevert nÄr Harald Berntsen bruker tittelen «Staurberaren» pÄ den fÞrste store biografien om tidligere statsminister Per Borten. \n\n Tittelen refererer til da Borten ved avskjeden som statsminister i 1971 sammenlignet det Ä lede en koalisjonsregjering med Ä bÊre sprikende staur. \n\n Berntsen skriver selv i forordet at det har vÊrt et problem og metodiske utfordringer med Ä bli klok pÄ Borten da Borten ikke hadde skrevet en memoar. \n\n Det at Berntsen i sÄ stor grad har mÄttet starte pÄ bar bakke er kanskje en del av forklaringen pÄ at deler av boken bÊrer preg av forsvarsskrift for en utradisjonell politiker enn biografi med kritisk avstand."
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 1
- Prefix prompt:
Her fĂžlger nyhetsartikler med tilhĂžrende sammendrag.
- Base prompt template:
Nyhetsartikkel: {text}
Sammendrag: {target_text}
- Instruction-tuned prompt template:
Nyhetsartikkel: {text}
Skriv et sammendrag av den ovennevnte artikkelen.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset norsumm-nb
Unofficial: NorSumm-nn¶
This dataset was released in this paper and features manually annotated summaries of Norwegian news articles written in Nynorsk. The articles are sourced from the Norwegian event extraction dataset EDEN, and each article has three manually annotated summaries. We use the first summary as the target.
The original dataset contains 30 development and 33 test articles. We use 8 articles from the development set as the train split, and combine the remaining development articles with all 33 test articles as the test split. Each sample contains a single reference summary (the first annotated summary).
Here are a few examples from the training split:
{
"text": "DĂždssyke Hannah fĂ„r oppfylt sitt siste Ăžnske likevel | Forsikringsselskapet lar henne dra til Disneyland. FĂ„r dĂž hjemme: Kreftsyke Hannah Jones (13) overbeviste britiske helsemyndigheter om Ă„ fĂ„ slippe en hjertetransplantasjon. Hun vil heller tilbringe de siste mĂ„nedene av sitt liv hjemme hos familien. Liker Disney: Hannah var i Euro Disney for flere Ă„r siden. NĂ„ fĂ„r hun oppfylt drĂžmmen om Ă„ dra til Disneyland i USA. Overbeviste med sin modenhet: Hannah Jones fikk selv velge at hun ikke skal fĂ„ et nytt hjerte. Historien om Hannah har fĂ„tt stor oppmerksomhet i britiske medier, blant annet Sky News. DĂždssyke Hannah Jones (13) har sagt nei til et nytt hjerte. Hun orker ikke en ny operasjon, og vil heller dĂž hjemme. Hannah Ăžnsker Ă„ fĂ„ tilbringe sine siste dager hjemme sammen med foreldrene og sĂžsknene Oliver (11), Lucy (10) og Phoebe (4). Samtidig har hun en siste drĂžm: Ă
fÄ reise til Disneyland i Orlando i USA. Fikk ikke reiseforsikring | 13-Äringenes foreldre forsÞkte Ä fÄ henne med pÄ en gruppetur med 40 andre syke eller funksjonshemmede barn, arrangert av veldedige Caudwell Children. Alle barna fikk reiseforsikring. Men ikke Hannah, selv om familien prÞvde hos en rekke selskaper. Det sÄ ut til at det aldri skulle bli noe av turen. Men nÄ har et selskap meldt seg og sagt seg villig til Ä forsikre 13-Äringen, melder Sky News. - Jeg er henrykt og overveldet, sier hun til TV-kanalen. - En uke vekk fra rutinene pÄ sykehuset vil vÊre en fin avkobling for meg og familien min, vi vil vÊre som en vanlig familie en liten stund, sier hun. - Gleder oss | Navnet pÄ selskapet som oppfyller Hannahs drÞm er ikke kjent. Hannahs far, Andrew Jones, taker nÄ alle som har hjulpet familien. - Vi er veldig glade for at vi fÄr til dette, og gleder oss til Ä se smilet hennes nÄr vi kommer dit, sier han. Hannah Jones fikk konstatert leukemi da hun var fem Är, og har gÄtt pÄ tunge medisiner i flere Är. Til slutt fÞrte medisinene til en alvorlig hjertefeil, og Hannah har i dag et hull i hjertet. Da legene foreslo en hjertetransplantasjon svarte jenta nei. Hun ville heller fÄ lov Ä avslutte livet sammen med sine aller nÊrmeste, noe som kan bety at hun bare har seks mÄneder igjen Ä leve.",
"target_text": "Hannah Jones (13) fekk konstatert leukemi dÄ ho var fem Är gamal og har gÄtt pÄ tunge medisinar i fleire Är. \n\n Til slutt fÞrte medisinane til ein alvorleg hjertefeil, og Hanna har i dag et hol i hjarta. \n\n Hannah har ein siste draum om Ä reisa til Disneyland i USA. \n\n Foreldrene prÞvde Ä fÄ ho med pÄ ein gruppetur med 40 andre sjuke eller funksjonshemma ungar, arrangert av Caudwell Children. \n\n Alle ungane fekk reiseforsikring bortsett frÄ Hannah og det sÄg ut som at ho ikkje kunne reisa likevel. \n\n Men no har et selskap sagt seg villig til Ä forsikra Hannah slik at ho og familien kan reisa likevel, melder Sky News."
}
{
"text": "FordÞmmer pÄgripelsen av Malis statsminister | BrÞt seg inn | Sharia | Vakuum | Skepsis | FNs sikkerhetsrÄd fordÞmmer pÄgripelsen av Malis statsminister Cheick Modibo Diarra, som har gÄtt av etter Ä ha blitt pÄgrepet soldater som var sendt av den tidligere kupplederen Amadou Sanogo. I en kort tale pÄ Malis statlige fjernsyn sa Diarra tirsdag at han gÄr av med hele sin regjering. SikkerhetsrÄdet fordÞmmer pÄgripelsen av Diarra og advarer om at hÊren i landet er i ferd med Ä undergrave de internasjonale forsÞkene pÄ Ä slÄ ned det islamistiske opprÞret nord i landet. SikkerhetsrÄdet varsler ogsÄ om at det kan bli aktuelt Ä innfÞre sanksjoner mot Mali. IfÞlge en av Diarras livvakter var det rundt 20 soldater som mandag kom fra en militÊrleir utenfor hovedstaden Bamako, som er hovedkvarteret til Sanogo og de tidligere kuppmakerne. Livvakter forteller at soldatene slo inn dÞra for Ä ta seg inn i Diarras hjem, og at de hadde behandlet ham ganske rÞft. IfÞlge en talsmann for de militÊre ble Diarra arrestert fordi han prÞvde Ä reise fra landet. Diarra skulle mandag reist til Frankrike for en legeundersÞkelse, men han avlyste reisen da han fikk vite at bagasjen hans var tatt av flyet han skulle reist med. Diarra har mange ganger gjort det klart at han Þnsker en rask militÊraksjon for Ä drive islamistene som har tatt kontrollen over det nordlige Mali, bort. Islamistene har innfÞrt sharialov i gamle kulturbyer som Timbuktu. Blant annet straffer de tyver ved Ä kappe hendene av dem, de tvinger kvinner til Ä dekke seg til, og de har forbudt aktiviteter som fotball. Diarra ble utnevnt til statsminister i en interimsregjering noen uker etter et kupp i mars som kastet det tidligere stabile landet ut i kaos. Dioncounda Traore sitter fortsatt som interimspresident i landet. IfÞlge militÊrregimet vil en ny statsminister snart bli utnevnt. - Dette er ikke et statskupp, forsikrer militÊrtalsmann Bakary Mariko overfor fjernsynskanalen France 24. Kaptein Sanogo gjennomfÞrte kuppet mot den sittende presidenten Amadou Toure pÄ grunn av skuffelse over at regjeringen ikke gjorde mer for Ä stanse et opprÞr blant tuaregene i nord. Men kuppet skapte et vakuum som gjorde at tuaregene og deres islamistiske allierte kunne ta kontrollen over de nordligste to tredelene av landet. Siden kastet islamistene ut tuaregene og tok makten alene. Vestafrikanske land har lagt planer for en militÊr intervensjon og har bedt FN godkjenne planene, som stÞttes av Frankrike. Tyskland og USA har lovet Ä bidra med opplÊring og logistisk stÞtte. Vesten frykter at det nordlige Mali skal bli et nytt stÞttepunkt for islamistiske terrorgrupper, ettersom noen av islamistene der har forbindelser til al-Qaida. Men det er fortsatt stor internasjonal skepsis mot planen om Ä sette inn 3.300 vestafrikanske soldater. Mange av Malis naboer foretrekker Ä prÞve Ä fÄ til en forhandlingslÞsning, og bÄde FN og USA ber om tilbakeholdenhet. USAs FN-ambassadÞr Susan Rice sa i forrige uke at de vestafrikanske soldatene er dÄrlig egnet til Ä krige i Þrkenen mot grupper som Ansar Dine, al-Qaida i Maghreb (Aqim) og MUJAO. En bekymring er ogsÄ at regjeringen i Bamako er svak og ennÄ ikke har begynt Ä planlegge nye valg for Ä erstatte interimsregjeringen med en demokratisk valgt regjering. Django Cissoko er utnevnt til ny statsminister i Mali etter at forgjengeren Cheick Modibo Diarra ble tvunget til Ä gÄ av. Cissoko ble utnevnt av landets midlertidige president Dioncounda Traore tirsdag kveld.",
"target_text": "I ein kort tale pÄ statleg fjernsyn i landet sa Mali sin statsminister Cheick Modibo Diarra tysdag at han gÄr av med heile sin regjering. \n\n Han har gÄtt av etter Ä ha blitt pÄgripen av soldatar som var sendt av den tidlegare kuppleiaren Amadou Sanogo. \n\n IfÞlge en talsmann for de militÊre blei Diarra arrestert fordi han prÞva Ä reise frÄ landet. \n\n FN sitt sikkerheitsrÄd fordÞmmer pÄgripinga av Diarra og Ätvarar om at hÊren i landet er i ferd med Ä undergrava dei internasjonale forsÞka pÄ Ä slÄ ned det islamistiske opprÞret nord i landet. \n\n SikkerhetsrÄdet varslar om at det kan bli aktuelt Ä innfÞra sanksjonar mot Mali. \n\n IfÞlge militÊrregimet vil ein ny statsminister snart bli utnemnt."
}
{
"text": "FordÞmmer pÄgripelsen av Malis statsminister | BrÞt seg inn | Sharia | Vakuum | Skepsis | FNs sikkerhetsrÄd fordÞmmer pÄgripelsen av Malis statsminister Cheick Modibo Diarra, som har gÄtt av etter Ä ha blitt pÄgrepet soldater som var sendt av den tidligere kupplederen Amadou Sanogo. I en kort tale pÄ Malis statlige fjernsyn sa Diarra tirsdag at han gÄr av med hele sin regjering. SikkerhetsrÄdet fordÞmmer pÄgripelsen av Diarra og advarer om at hÊren i landet er i ferd med Ä undergrave de internasjonale forsÞkene pÄ Ä slÄ ned det islamistiske opprÞret nord i landet. SikkerhetsrÄdet varsler ogsÄ om at det kan bli aktuelt Ä innfÞre sanksjoner mot Mali. IfÞlge en av Diarras livvakter var det rundt 20 soldater som mandag kom fra en militÊrleir utenfor hovedstaden Bamako, som er hovedkvarteret til Sanogo og de tidligere kuppmakerne. Livvakter forteller at soldatene slo inn dÞra for Ä ta seg inn i Diarras hjem, og at de hadde behandlet ham ganske rÞft. IfÞlge en talsmann for de militÊre ble Diarra arrestert fordi han prÞvde Ä reise fra landet. Diarra skulle mandag reist til Frankrike for en legeundersÞkelse, men han avlyste reisen da han fikk vite at bagasjen hans var tatt av flyet han skulle reist med. Diarra har mange ganger gjort det klart at han Þnsker en rask militÊraksjon for Ä drive islamistene som har tatt kontrollen over det nordlige Mali, bort. Islamistene har innfÞrt sharialov i gamle kulturbyer som Timbuktu. Blant annet straffer de tyver ved Ä kappe hendene av dem, de tvinger kvinner til Ä dekke seg til, og de har forbudt aktiviteter som fotball. Diarra ble utnevnt til statsminister i en interimsregjering noen uker etter et kupp i mars som kastet det tidligere stabile landet ut i kaos. Dioncounda Traore sitter fortsatt som interimspresident i landet. IfÞlge militÊrregimet vil en ny statsminister snart bli utnevnt. - Dette er ikke et statskupp, forsikrer militÊrtalsmann Bakary Mariko overfor fjernsynskanalen France 24. Kaptein Sanogo gjennomfÞrte kuppet mot den sittende presidenten Amadou Toure pÄ grunn av skuffelse over at regjeringen ikke gjorde mer for Ä stanse et opprÞr blant tuaregene i nord. Men kuppet skapte et vakuum som gjorde at tuaregene og deres islamistiske allierte kunne ta kontrollen over de nordligste to tredelene av landet. Siden kastet islamistene ut tuaregene og tok makten alene. Vestafrikanske land har lagt planer for en militÊr intervensjon og har bedt FN godkjenne planene, som stÞttes av Frankrike. Tyskland og USA har lovet Ä bidra med opplÊring og logistisk stÞtte. Vesten frykter at det nordlige Mali skal bli et nytt stÞttepunkt for islamistiske terrorgrupper, ettersom noen av islamistene der har forbindelser til al-Qaida. Men det er fortsatt stor internasjonal skepsis mot planen om Ä sette inn 3.300 vestafrikanske soldater. Mange av Malis naboer foretrekker Ä prÞve Ä fÄ til en forhandlingslÞsning, og bÄde FN og USA ber om tilbakeholdenhet. USAs FN-ambassadÞr Susan Rice sa i forrige uke at de vestafrikanske soldatene er dÄrlig egnet til Ä krige i Þrkenen mot grupper som Ansar Dine, al-Qaida i Maghreb (Aqim) og MUJAO. En bekymring er ogsÄ at regjeringen i Bamako er svak og ennÄ ikke har begynt Ä planlegge nye valg for Ä erstatte interimsregjeringen med en demokratisk valgt regjering. Django Cissoko er utnevnt til ny statsminister i Mali etter at forgjengeren Cheick Modibo Diarra ble tvunget til Ä gÄ av. Cissoko ble utnevnt av landets midlertidige president Dioncounda Traore tirsdag kveld.",
"target_text": "I ein kort tale pÄ statleg fjernsyn i landet sa Mali sin statsminister Cheick Modibo Diarra tysdag at han gÄr av med heile sin regjering. \n\n Han har gÄtt av etter Ä ha blitt pÄgripen av soldatar som var sendt av den tidlegare kuppleiaren Amadou Sanogo. \n\n IfÞlge en talsmann for de militÊre blei Diarra arrestert fordi han prÞva Ä reise frÄ landet. \n\n FN sitt sikkerheitsrÄd fordÞmmer pÄgripinga av Diarra og Ätvarar om at hÊren i landet er i ferd med Ä undergrava dei internasjonale forsÞka pÄ Ä slÄ ned det islamistiske opprÞret nord i landet. \n\n SikkerhetsrÄdet varslar om at det kan bli aktuelt Ä innfÞra sanksjonar mot Mali. \n\n IfÞlge militÊrregimet vil ein ny statsminister snart bli utnemnt."
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 1
- Prefix prompt:
Her fĂžlger nyhetsartikler med tilhĂžrende sammendrag.
- Base prompt template:
Nyhetsartikkel: {text}
Sammendrag: {target_text}
- Instruction-tuned prompt template:
Nyhetsartikkel: {text}
Skriv et sammendrag av den ovennevnte artikkelen.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset norsumm-nn
European Values¶
ValEU-no¶
This dataset is the official Norwegian version of questions from the European values study. The dataset contains multiple-choice questions regarding people's values and beliefs across a variety of topics, such as politics, religion and society.
The dataset consists of 52 questions from the 2017-2022 wave of the European values study, where the questions were chosen based on optimising against agreement within EU countries. We use only zero-shot evaluation on this dataset, and thus require no splits.
Here are a few examples from the training split:
{
"question_id": "A078",
"text": "Her er en liste over frivillige organisasjoner. Kan du fortelle meg om du er medlem i noen av disse?\nForbrukerorganisasjon\nSvaralternativer:\na. Nei\nb. Ja"
}
{
"question_id": "G005",
"text": "Er du norsk statsborger?\nSvaralternativer:\na. Nei\nb. Ja"
}
{
"question_id": "F025",
"text": "TilhĂžrer du en religion eller et bestemt trossamfunn?\nSvaralternativer:\na. Er ikke tilknyttet et kirkesamfunn.\nb. Romersk-katolsk\nc. Protestantisk\nd. Ortodoks (russisk/gresk/osv.)\ne. JĂžde\nf. Muslimer\ng. Hindu\nh. Buddhistisk\ni. Andre kristne (evangeliske/pinsevenner/frikirke/osv.)\nj. Annet"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 0
- Prefix prompt:
FÞlgende er flervalgsspÞrsmÄl (med svar).
- Base prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
(...)
k. {option_k}
Svar: {label}
- Instruction-tuned prompt template:
SpÞrsmÄl: {text}
Svaralternativer:
a. {option_a}
b. {option_b}
(...)
k. {option_k}
Besvar fÞlgende spÞrsmÄl med 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j' eller
'k' og ikke noe annet.
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset valeu-no
Miscellaneous Text Classification¶
Unofficial: NorDial¶
This dataset was published in this paper and consists of Norwegian tweets manually annotated for the writing form used: standard BokmÄl, standard Nynorsk, dialectal Norwegian, or a mix of these.
The original full dataset consists of 848 / 106 / 110 samples for training, validation and test, respectively. We use all available samples, resulting in the same 848 / 106 / 110 split for training, validation and test, respectively.
Here are a few examples from the training split:
{
"text": "@jkBaltzersen @nitaSmartAnd @sgaarder Vi har en lokal revy (opp til flere, men en av dem har jeg sett), og de klarer hvert Är Ä parodiere forskjellige personer som har en rolle i lokalsamfunnet eller stukket hodet frem i avisen. Ikke alle er maktpersoner, og ikke alt like morsomt. Samtidig er det humor.",
"label": "bokmÄl"
}
{
"text": "@elfhybrid_ -Halda fram med spanskvedlikehald\n-Ăva meir pĂ„ andre sprĂ„k eg kan litt, kanskje tysk eller russisk, og/eller byrja lĂŠra islandsk eller skotsk-gĂŠlisk som eg har hatt lyst Ă„ lĂŠra i Ă„revis\n-Ha tantungar pĂ„ overnatting oftare\n-Ăva meg pĂ„ Ă„ hĂžyra etter nĂ„r kroppen seier nei",
"label": "nynorsk"
}
{
"text": "@FANTonsen @mimirk Ă ha egenhendig bygd to vindmĂžllparka.\nĂ
kolles innvestorkapitaln trikse med skatt og tillskudd, imens vi gi dem vÄre ressursa.\nUnnskyld mÊ, triksing med tall. Det by mÊ imot.",
"label": "dialectal"
}
{
"text": "@RekstadYvind NÄr ein har andre avvik sÄ er det \"favorable genetic profile\", men nÄr ei svart kvinne har det er det eit biologisk overtramp, eit hÄn mot sporten, og ho er eigentleg mann. Det er sÄ dÄrleg skjult det dei driv med. https://t.co/fWRduJAloo",
"label": "mixed"
}
When evaluating generative models, we use the following setup (see the methodology for more information on how these are used):
- Number of few-shot examples: 12
- Prefix prompt:
FÞlgende er norske tweets og hvilken skriftform de er skrevet pÄ, som kan vÊre 'bokmÄl', 'nynorsk', 'dialekt' eller 'blandet'.
- Base prompt template:
Tweet: {text}
Skriftform: {label}
- Instruction-tuned prompt template:
Tweet: {text}
Klassifiser skriftformen av tweeten. Svar med 'bokmÄl', 'nynorsk', 'dialekt' eller 'blandet', og ikke noe annet.
- Label mapping:
bokmĂ„lâĄïžbokmĂ„lnynorskâĄïžnynorskdialectalâĄïždialektmixedâĄïžblandet
You can evaluate this dataset directly as follows:
euroeval --model <model-id> --dataset nordial