• 1.Jak se odhalují podobnosti textu (podezření na plagiát) v IS PCU?
    Tip

    Aktuálně dochází k souběhu původního algoritmu a nového algoritmu (nasazeného v roce 2021). Následující nápověda popisuje nový algoritmus. Můžete se podívat i na nápovědu k původní verzi.

    Obsah souborů v datovém úložišti IS PCU, u kterých je k dispozici čistě textová verze, je průběžně strojově analyzován. Každý dokument (závěrečná práce, seminární práce, esej, prezentace, ...), který si uživatel v systému vyhledá, lze porovnat a zobrazit k němu zdroje, které mají podobný text:
    • klikněte na řádek se souborem (kliknutí pravým tlačítkem myši vyvolá panel podrobností vpravo, kliknutí levým tlačítkem vyvolá kontextové menu),
    • použijte operaci „Vyhledat podobné dokumenty“ (ikona dvou vajíček „podobných jako vejce vejci“),
    • využijte zobrazené podobnosti (či upravte nastavení a nechejte si podobnosti přepočítat) k tomu, abyste mohli posoudit, jestli se může jednat o plagiát, nebo nikoliv.

    1 Operace „Vyhledat podobné dokumenty“.

    U nalezených podobných dokumentů IS PCU vypíše míru shody v procentech. K dispozici je i celková spočítaná podobnost dokumentu s ostatními:

    1 Procento celkové podobnosti s dokumenty v databázi a zdroji z internetu.

    2 Seznam zdrojových dokumentů, se kterými je dokument podobný. U každého je zobrazeno procento podobnosti.

    3 U každého zdrojového dokumentu je menu pod ikonou tří teček, kde lze o dokumentu zjistit více informací.

    4 Za pomoci křížku lze odstranit z výpočtu zdrojový dokument, který není pro porovnání podobností relevantní (například z něj měl student čerpat a má jej řádně citovaný).

    5 Po kliknutí na vybranou zvýrazněnou podobnou pasáž se zobrazí dokumenty, se kterými je text podobný.

    6 Číslo v oválu označuje počet dokumentů, se kterými je následující pasáž podobná.

    7 Po kliknutí se přehledně zobrazí počty zobrazených, přeskočených i vyřazených dokumentů včetně vysvětlení.

    8 Ovály s čísly udržují přehled o zdrojových dokumentech. Přeskočené dokumenty lze zobrazit, vyřazené dokumenty obnovit.

    Procento podobnosti je jen orientační údaj, dokument nebo jeho část může být plagiátem, i když procento je významně nízké. Spočítání podobných dokumentů je rychlé, kontrola podobností je možná ihned po vytvoření textové verze souboru.

  • 2.Mezi jakými pracemi se podobnosti porovnávají?

    Systém vyhledává podobnosti napříč sdílenou databází porovnávaných dokumentů, která zahrnuje vedle dokumentového serveru IS PCU i závěrečné práce zapojených škol v systému Theses.cz, seminární a jiné práce v systému Odevzdej.cz, vědecké publikace v systému Repozitar.cz a další dokumenty v informačních systémech provozovaných MU.

    Protože je výrazné množství prací a dokumentů neveřejných, prohledávání společné databáze je efektivním nástrojem pro vyhledávání možných plagiátů. Student nemůže jen tak odevzdat seminární práci svého kamaráda z jiné školy, protože je vysoká pravděpodobnost, že již v systému je a našly by se s ní podobnosti. Zadání témat seminárních a závěrečných prací se často opakuje, a je tedy pravděpodobné, že systém již bude vědět o zdrojových dokumentech, ze kterých se pro toto téma obvykle čerpá.

    Součástí vyhledávání podobností je také algoritmus, který porovnávaný dokument analyzuje a zkoumá vůči zdrojům z internetu. Tento postup má různá technická omezení a je výpočetně a časově náročnější. Proto je přednostně používán pro archivy závěrečných prací. Seminární práce v odevzdávárnách a dlouhé odpovědi v odpovědnících jsou kvůli rychlosti zpracování primárně porovnávány vůči sdílené databázi všech zdrojových dokumentů. Ta zahrnuje mj. i zdroje z internetu někdy v minulosti dohledané pro účely kontroly některé z milionů porovnávaných závěrečných prací.

    Určitý rozdíl mezi vyhledáváním podobností k seminárním pracím (pro které je používána ona sdílená databáze zdrojů) a závěrečným pracím (k nimž je sdílená databáze zdrojů obohacena o nově stažené zdroje z internetu) tu nicméně je. Není se ale třeba obávat, databáze je opravdu rozsáhlá, díky čemuž ve většině případů systém „zná“ dostatek zdrojů, ze kterých studenti obvykle čerpají, a také dostatek zdrojů, ze kterých obvykle studenti opisují.

  • 3.Chci prověřit originalitu závěrečné práce
    Tip

    Aktuálně dochází k souběhu původního algoritmu a nového algoritmu (nasazeného v roce 2021). Následující nápověda popisuje nový algoritmus. Můžete se podívat i na nápovědu k původní verzi.

    Vedoucí práce, který zpravidla chce prověřit kvalitu práce při psaní posudku, postupuje pomocí

    Informační systém Školitel (vybraný student) Archiv závěrečné práce

    a zvolí „Vyhledat podobné dokumenty“. Uvidí celkové procento podobností a vyznačené podobnosti, které může pomocí šipek postupně projít a posoudit, zda jsou úseky řádně citovány.

    1 Předtím, než vedoucí práce potvrdí, že byla provedena kontrola práce, by měl použít funkci „Vyhledat podobné dokumenty“ a posoudit případnou shodu.

    Pozor

    Je na čtenáři, aby posoudil význam nalezených podobností, tj. zda například student korektně cituje. Originalitu závěrečné práce nejlépe posoudí vedoucí práce (je nejvíce obeznámen s publikacemi v oboru).

  • 4.Najde nový algoritmus stejné podobnosti jako ten původní?

    Nový algoritmus je zacílený především na parafrázované úseky. Tedy na místa v textu, která student jen zkopíroval a následně lehce přeformuloval. Právě na takové pasáže by měl nový algoritmus oproti původnímu upozornit.

    Na druhou stranu nemusí vyhodnotit jako podobné velmi krátké pasáže, které obvykle nejde ani jinak vyjádřit. Například:

    • krátký řádek citace,
    • přesný název zákona,
    • názvy kapitol a menu,
    • krátká prohlášení či poděkování v závěrečných pracích,
    • krátké obecné definice a ustálená krátká tvrzení,
    • a další obdobné krátké úseky, které neukazují na opisování.

    1 Ukázky podobností, které již nemusí být zobrazeny.

    Procento celkové podobnosti kvůli popsaným změnám bude rozdílné, často i výrazně. Nový algoritmus by měl ukazovat zejména ty úseky, které je opravdu dobré prověřit.

    Tip

    Nenašel nový algoritmus významný podezřelý úsek a starý ano? Dejte nám v tomto případě, prosím, vědět na adresu theses@fi.muni.cz.

  • 5.Potřebuji dokument porovnat s neveřejným dokumentem
    Tip

    Aktuálně dochází k souběhu původního algoritmu a nového algoritmu (nasazeného v roce 2021). Následující nápověda popisuje nový algoritmus. Můžete se podívat i na nápovědu k původní verzi.

    Pokud máte dokument v podobě, z níž lze vytvořit textovou verzi (není to tedy např. obrázek), vložte jej kamkoliv do IS PCU (např. do Poskytovny, do Studijních materiálů předmětu nebo do Mého webu) a IS PCU jej do mechanismu vyhledání podobností zahrne.

    Standardně se dokumenty od stejného vkladatele neporovnávají. Je tedy potřeba rozkliknout možnost „Upravit hledání nebo vybrat jiný dokument“, zvolit volbu „zahrnout dokumenty stejného vkladatele“ a zobrazit:

    1 Kliknutím zde zobrazíte nastavení dalších parametrů hledání.

    2 Pro porovnávání i mezi Vašimi vlastními dokumenty zaškrtněte volbu „zahrnout dokumenty stejného vkladatele“.

  • 6.Jak funguje vyhledávací algoritmus?
    Tip

    Aktuálně dochází k souběhu původního algoritmu a nového algoritmu (nasazeného v roce 2021). Následující nápověda popisuje nový algoritmus. Můžete se podívat i na nápovědu k původní verzi.

    Jedná se o porovnávání dokumentů mezi sebou:

    • U každého dokumentu v databázi se generuje textová prohledávatelná verze. Algoritmus se v této textové verzi zaměřuje na podobné nebo parafrázované úseky textů a vyhodnocuje míru shody napříč celou sdílenou databází dokumentů, včetně zdrojů z internetu.
    • Srovnávají se texty v češtině, angličtině a slovenštině, podmínkou je, aby měly alespoň pár vět či odstavců (v úplně malých souborech není dostatek textu pro jejich analýzy a nalezení podobností).
    • Předtím, než se výsledek prezentuje uživateli, jsou vynechány ty dokumenty, které se překrývají jen v pasážích, jež jsou stejné jako u dříve nalezených zdrojů. Prakticky jde například o citace určitého zákona v další stovce závěrečných pracích a dokumentů na internetu. Pokud je podobných zdrojů méně než 10, zobrazí se pro přehlednost všechny bez vynechávání.
    • Uživateli se zobrazí ty nejvíce relevantní dokumenty, u kterých dochází k významné podobnosti s hledaným dokumentem, a procento míry této podobnosti.

    Pokud od sebe budou studenti vzájemně opisovat, systém vyhodnotí jejich odpovědi jako podobné a zobrazí procento podobnosti. Více na toto téma naleznete v otázce Mezi jakými pracemi se podobnosti porovnávají?

    Tip: Opisovat se nevyplatí

    Jako varovný mechanismus pro studenty je důležité, že odevzdané práce jsou v IS PCU archivovány a mohou být podrobeny zkoumání opakovaně. Například kdykoliv později další vylepšenou verzí algoritmu. Nezapomeňte, že čas ušetřený opisováním může jednou znamenat mnoho práce navíc s napravováním vlastní reputace. Vývojáři IS PCU postupně algoritmus vylepšují a databáze prohledávaných dokumentů se neustále rozšiřuje o další zdroje. Co dnes systémy neodhalí, neznamená, že neodhalí zítra.

  • 7.Systém našel k mé práci podobnosti, co to znamená?
    Tip

    Aktuálně dochází k souběhu původního algoritmu a nového algoritmu (nasazeného v roce 2021). Následující nápověda popisuje nový algoritmus. Můžete se podívat i na nápovědu k původní verzi.

    Autoři si mohou ověřit, zda nedošlo k použití jejich textu v díle jiného autora.

    Důležité upozornění!

    Podobnost, kterou systém nalezl mezi Vaší prací a prací/pracemi v databázi, nemusí vždy nutně znamenat, že se u jedné z prací jedná o plagiát. Každou práci (podobnost) musí posoudit odborník na dané téma. Neexistuje žádná hodnota %, od které lze práci považovat za plagiát.

    Co zobrazuje rozhraní vyhledávání podobností a jak jej využít:

    1 Procento celkové podobnosti s dokumenty v databázi a zdroji z internetu.

    2 Seznam zdrojových dokumentů, se kterými je dokument podobný. U každého je zobrazeno procento podobnosti.

    3 U každého zdrojového dokumentu je menu pod ikonou tří teček, kde lze o dokumentu zjistit více informací.

    4 Za pomoci křížku lze odstranit z výpočtu zdrojový dokument, který není pro porovnání podobností relevantní (například z něj měl student čerpat a má jej řádně citovaný).

    5 Po kliknutí na vybranou zvýrazněnou podobnou pasáž se zobrazí dokumenty, se kterými je text podobný.

    6 Číslo v oválu označuje počet dokumentů, se kterými je následující pasáž podobná.

    7 Po kliknutí se přehledně zobrazí počty zobrazených, přeskočených i vyřazených dokumentů včetně vysvětlení.

    8 Ovály s čísly udržují přehled o zdrojových dokumentech. Přeskočené dokumenty lze zobrazit, vyřazené dokumenty obnovit.

  • 8.Systém nenašel dokument na internetu, ze kterého student opisoval
    Tip

    Aktuálně dochází k souběhu původního algoritmu a nového algoritmu (nasazeného v roce 2021). Následující nápověda popisuje nový algoritmus. Můžete se podívat i na nápovědu k původní verzi.

    Část podobných dokumentů nepřináší informaci o nové shodě, jen opakující se podobné pasáže zobrazených zdrojových dokumentů. Tyto dokumenty systém přeskočí. Prakticky jde například o rozsáhlejší citace určitého zákona v další stovce závěrečných prací a dokumentů na internetu. Uživatelé tedy nyní neuvidí všechny dokumenty, ve kterých jsou například citovány odstavce z autorského zákona, ale zobrazí se pouze jeden z nich. Ten, který má i nejvíce dalších podobností se zvoleným dokumentem.

    1 Šedý ovál ukazuje počet přeskočených dokumentů, kliknutím na něj se zobrazí seznam těchto dokumentů.

    Jako první je potřeba se podívat, jestli se jen nezobrazuje jiný dokument, který danou podobnost obsahuje. Například zda systém neoznačil rovnou sbírku zákonů s textem daného zákona, a nikoliv článek v novinách, který stejný článek komentuje.

    Tip

    K přeskakování dokumentů dochází až v případě, je-li nalezených dokumentů více než 10. Do té doby se dokumenty pro přehlednost ukazují všechny.

    Pozor

    Seminární práce v odevzdávárnách a dlouhé odpovědi v odpovědnících jsou kvůli rychlosti zpracování porovnávány primárně pouze vůči sdílené databázi všech zdrojových dokumentů. Je zde tedy rozdíl oproti hledání podobností u závěrečných prací, kde každou závěrečnou práci systém podrobí i přímému zkoumání podobností vůči internetu.

    Není třeba se ale obávat, databáze je opravdu rozsáhlá. Ve většině případů tedy už systém „zná“ dostatek zdrojů, ze kterých studenti obvykle čerpají, a také dostatek zdrojů, ze kterých obvykle studenti opisují.

    Tip

    Pokud vyučující zadává seminární práci na velmi aktuální a nové téma a nebo velmi okrajovou problematiku, může se stát, že ji zatím ještě nikdo v závěrečných pracích nereflektoval. Potom sdílená databáze všech zdrojových dokumentů nemusí ještě toto téma pokrývat. V těchto případech lze doporučit, aby učitelé studentům do studijních materiálů do IS PCU nahráli zajímavé, relevantní a hodnotné zdroje pro jejich inspiraci či studium. Zároveň takto budou mít jistotu, že z nich nebudou opisovat.

  • 9.Kontrolují se i odpovědi v Odpovědnících?
    Systém také kontroluje delší texty vepsané jako odpovědi do Odpovědníků. Kontrolují se odpovědi na otázky typu „Vepište text“ (:a) , pokud bylo vepsáno více jak 50 znaků. Tyto odpovědi automaticky systém vkládá do Studijních materiálů předmětu, je-li odpovědník ve studijních materiálech. Pokud odpovědník není ve studijních materiálech, pak se ukládají pod soubor s popisem odpovědníku. Tyto soubory nejsou studentům implicitně dostupné.

    Pro kontrolu odpovědí v Odpovědnících lze použít:

    Informační systém Učitel (vybraný předmět) Správa odpovědníku (vybraný odpovědník) odpovědi Kontrola opisování dlouhých textů

    1 Zde je možné zkontrolovat najednou odpovědi v celém odpovědníku.

    Zobrazí se jednotlivé soubory, jména studentů a procento podobnosti. Ke každému souboru (tedy jednotlivé dlouhé odpovědi v odpovědníku) si můžete rozkliknout podobnosti pro podrobnější zkoumání.

    Pozor

    Zajímá vás, mezi jakými texty se podobnosti v Odpovědnících vyhledávají? Více na toto téma naleznete v otázce Mezi jakými pracemi se podobnosti porovnávají?

    Tip

    Pokud vyučující nechtějí, aby studenti při testu opisovali z jejich prezentací a učebních textů, je možné studentům do studijních materiálů do IS PCU tyto soubory nahrávat. Dostanou se tak do sdílené databáze porovnávaných dokumentů a dlouhé odpovědi v Odpovědnících budou vůči nim porovnávány.

  • 10.Jak mohu kontrolovat originalitu prací odevzdaných v Odevzdávárnách?
    Nástroj pro hledání podobností může pomoci zamezit opisování či znovuodevzdávání prací spolužáků z vyšších ročníků. Pokud od sebe budou studenti vzájemně opisovat, systém vyhodnotí jejich odpovědi jako podobné a zobrazí procento podobnosti. Pro kontrolu prací v odevzdávárně použijte:
    Informační systém Učitel (vybraný předmět) Odevzdávárny (vybraná odevzdávárna) ikona "podobné jako vejce vejci"

    1 Zde je možné zkontrolovat najednou odpovědi v celé odevzdávárně.

    Zobrazí se jednotlivé soubory, jména studentů a procento podobnosti.

    Pozor

    Zajímá vás, mezi jakými texty se podobnosti v Odevzdávárnách vyhledávají? Více na toto téma naleznete v otázce Mezi jakými pracemi se podobnosti porovnávají?

    Tip

    Pokud vyučující nechce, aby studenti při testu opisovali z jeho prezentací a učebních textů, je dobré, aby studentům do studijních materiálů do IS PCU tyto soubory nahrávali. Dostanou se tak do sdílené databáze porovnávaných dokumentů a dlouhé odpovědi v Odpovědnících budou vůči nim porovnávány.

  • 11.Co se stane, když budu opisovat?
    Plagiátorství (opisování, zhotovování napodobenin) je neetická činnost a podvodné jednání, která nemá na vysoké škole svoje místo. Převzetí textu jiného autora bez viditelného označení převzatého textu s uvedením přesné citace zdroje představuje neoprávněný zásah do autorského práva v rozporu s autorským zákonem. Za přestupek hrozí sankce, a to třeba i po ukončení studia.


Nenašli jste odpověď? Pošlete nám svůj dotaz na pcuis(zavináč/atsign)fi(tečka/dot)muni(tečka/dot)cz.