LU Eksakto zinātņu un tehnoloģiju fakultātes Datorikas nodaļas bakalaura un maģistra studiju programmas kursi:
- BSP: Valodu tehnoloģiju pamati (DatZB022-LV, DatZB022-EN)
- MSP: Valodu tehnoloģiju lietojumi (DatZM037)
Kursā izmantotie termini; sk. arī Termini.gov.lv.
- Teksta izgūšana: TextExtraction.ipynb
- Teksta priekšapstrāde: TextPreprocessing.ipynb
- Dinamiski ielādēta daudzvalodu satura apstrāde: DW_scrape.ipynb
- Morfoloģiskā analīze un sintēze: HFST.ipynb, HFST_en_and_more.ipynb
- Teksta izvēršana un savēršana: Thrax.ipynb, Pynini.ipynb
- Latviešu valodas morfoloģiskais analizators un sintezators: TezaursAPI.ipynb
- Rīkkopas universālo atkarību parsēšanai: ParsingUD.ipynb
- N-grammu modeļi: NGram.ipynb
- TF-IDF : tf-idf.ipynb un Word2vec apmācība un lietojums: Word2vec.ipynb
- Teksta klasificēšana: LangID.ipynb, NaiveBayes.ipynb
Dr. Christos A. Frantzidisvies (Linkolnas Universitātes) lekcijas piemērs par teksta klasifikāciju: https://github.com/cfrantzidis/sleepCare
- Teksta klasificēšana: fastText.ipynb (1-layer, linear) → BERT.ipynb (deep, non-linear)
- Modeļi un demonstrācijas Hugging Face platformā:
- Skatīt Tasks, piemēram:
Feature Extraction: AiLab-IMCS-UL/lvbertFill-Mask: google-bert/bert-base-casedSentence Similarity: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
- Vārdšķiru un morfoloģiskā marķēšana (Part of Speech (POS) Tagging): POS_tagging.ipynb
- Nosaukto entitāšu marķēšana (Named entity recognition): NER.ipynb
- Teksta klasificēšana ar BERT: TextClassificationWithBERT.ipynb
- Tekstvienību klasificēšana ar BERT, T5 - interpunkcijas uzdevums: bert_punctuation.ipynb, seq2seq_punctuation.ipynb
- Tekstvienību pozicionālā kodēšana: positional_encoding.ipynb
- BERT jēdzienvektoru dimensiju reducēšana, vizualizēšana: PCA_of_BERT_embeddings.ipynb
- LLM darbināšana, izmantojot Ollama: ollama_LLMs_prompting.ipynb
- LLM novērtēšana - etalonuzdevumi: evaluation.ipynb
- LLM novērtēšana - perpleksitāte: llm_perplexity.ipynb
- Multimodālu tiešraides komentāru ģenerēšana: live_commentary_demo.ipynb
- LLM aģenti - ārēju rīku izsaukšana: LLM_ToolCalling.ipynb
- LLM aģenti - "vibe coding": LLM_VibeCode.ipynb
- RAG demonstrācija: RAG_demo.ipynb
- Eksperimenti latviešu valodā: speech_recognition.ipynb
- Valodas atpazīšana (klasificēšana): spoken_language_recognition.ipynb
LU HZF maģistra studiju programmas kurss:
prof. Inguna Skadiņa
prof. Normunds Grūzītis
Viesturs Jūlijs Lasmanis
Artūrs Znotiņš
Roberts Darģis
Paulis Filips Bārzdiņš
Kursa izstrādi finansē Eiropas Savienības Atveseļošanas un noturības mehānisma investīcija un valsts budžets projekta “Valodu tehnoloģiju iniciatīva” (2.3.1.1.i.0/1/22/I/CFLA/002) ietvaros.