Automatické třídění pošty pro IMAP servery
bachelor thesis (DEFENDED)
Obdržálek, David
Faculty of Mathematics and Physics
Department of Software Engineering
18. 9. 2006
Univerzita Karlova, Matematicko-fyzikální fakulta
Jelikož množství přijatých e-mailových zpráv rapidně stoupá, jsou uživatelé nuceni třídit je do několika kategorií. V předkládané práci představujeme nástroj, nazvaný Apofis, který pomáhá uživatelům automatizovat jejich rutinní každodenní práci s IMAP mailboxem tím, že jejich nové zprávy třídí a také postupně vytváří nová pravidla podle jejich chování, ovšem s tím, že stále ponechává uživateli možnost vytvářet, měnit nebo mazat pravidla a ovlivnit tak celý proces třídění a učení. V programu byl zaveden dvojúrovňový systém pravidel - finální pravidla, podle kterých se třídí, a potenciální pravidla, která byla vytvořena podle uživatelova chování a čekají na potvrzení dalšími úspěchy. Byly navrženy dva algoritmy na vytváření potenciálních pravidel - základní, rychlý nicméně v některých případech nedostatečný, a pokročilý algoritmus, který vylepšuje správnost vytváření pravidel tím, že při zjišťování relevance podmínek uvažuje uspořádání celého mailboxu. Tato práce obsahuje nejdůležitější informace a rozhodnutí o návrhu a implementaci aplikace a jejích algoritmů.
Number of received e-mail messages is growing explosively which forces users to classify them into several categories. In the presented work we introduce a tool called Apofis, which helps users to automate their routine every-day work with IMAP mailbox by sorting new messages for them and also by step-by-step creating of new rules based on their behaviour, while it still lets the user create, edit or delete the rules and thus affect the process of sorting and learning effectively. Two-level system of sorting rules is introduced - final rules, which the application uses to sort, and potential rules, which have been created according to user's behaviour and are waiting for more successes to prove their usability. Two potential rule learning algorithms were designed - the basic algorithm, fast but not accurate for some cases, and the advanced algorithm, which improves the accuracy by creating a new rule based on condition relevances determined from the organization of the whole mailbox. This thesis contains the most important facts and decisions about the design and implementation of the application and its algorithms.