摘要 | 第1-5页 |
Abstract | 第5-14页 |
Chapter 1 Introduction | 第14-26页 |
·Project Title | 第14页 |
·Project Overview | 第14-15页 |
·Research Problem | 第15页 |
·Research aims and objectives | 第15-16页 |
·Research methodology | 第16页 |
·State of Art | 第16-25页 |
·Email Filtering Methods | 第16-18页 |
·Format of Email Message | 第18-19页 |
·Message Transmitting Procedure | 第19-21页 |
·Machine Learning Methods | 第21-24页 |
·Features of Mobile Device | 第24-25页 |
·Resources | 第25页 |
·Organisation of the dissertation | 第25-26页 |
Chapter 2 Rationale for Na?ve Bayes and SVM | 第26-49页 |
·Introduction | 第26页 |
·Rationale for Na?ve Bayes Classifier | 第26-34页 |
·Probability Basis | 第27-28页 |
·Bayes Theorem | 第28-29页 |
·Mathematical Model | 第29-31页 |
·Na?ve Bayes Classifier | 第31页 |
·Probabilistic Event Models | 第31-34页 |
·Rationale for Support Vector Machine | 第34-46页 |
·SVM Classification | 第35页 |
·Linear Classifier | 第35-40页 |
·Soft-margin SVM Classification | 第40-42页 |
·Unbalanced Data | 第42页 |
·Nonlinear SVM | 第42-46页 |
·Summary of the Theoretical Comparison | 第46-47页 |
·Applicability Analysis | 第46页 |
·Cost for Updating | 第46-47页 |
·Classification Time | 第47页 |
·Conclusion | 第47-49页 |
Chapter 3 System Analysis and Design | 第49-67页 |
·Introduction | 第49页 |
·System Scope | 第49-51页 |
·Function Requirement | 第51-53页 |
·Overall System Architecture | 第53-55页 |
·Email Corpus | 第55页 |
·Evaluation Criteria | 第55-56页 |
·Message Representation Technique | 第56-58页 |
·Vector Space Model | 第56-57页 |
·TFIDF | 第57-58页 |
·Stop Words Elimination | 第58页 |
·Stemming | 第58页 |
·Attribute Selection | 第58-60页 |
·Information Gain | 第58-60页 |
·Gini Index | 第60页 |
·System Work Flow Design | 第60-66页 |
·System Work Flow | 第60-62页 |
·Message Pre-processing Steps | 第62-64页 |
·Classification Process | 第64-66页 |
·Conclusion | 第66-67页 |
Chapter 4 System Implementation | 第67-80页 |
·Introduction | 第67页 |
·MBM vs MM | 第67页 |
·Third Party Open Source Libraries | 第67-69页 |
·Weka | 第67-68页 |
·LibSVM - Type and Kernel Selection | 第68-69页 |
·WVTool | 第69页 |
·RapidMiner | 第69页 |
·Parameter Optimization for SVM | 第69-70页 |
·Module Flow Chart | 第70-78页 |
·Email Message Pre-processing | 第70-72页 |
·Attribute Selection | 第72-74页 |
·Machine Learning | 第74-75页 |
·Spam Detection Process | 第75-76页 |
·Basic Evaluation Process | 第76-78页 |
·Conclusion | 第78-80页 |
Chapter 5 Experimentation and System Evaluation | 第80-96页 |
·Introduction | 第80页 |
·Evaluation Criteria | 第80-83页 |
·Precision, Recall and Accuracy | 第80-82页 |
·F-measure | 第82页 |
·False Positive | 第82-83页 |
·Evaluation Method | 第83-84页 |
·Testing Environment | 第84页 |
·Analysis of Experimental Evaluation Result | 第84-91页 |
·C-SVC, nu-SVC and Kernel Choice for SVM | 第84-85页 |
·Preliminary Comparison Result for Effectiveness | 第85-86页 |
·Comparison Result for Training and Classification Time | 第86-87页 |
·Memory and CPU Usage | 第87-91页 |
·Analysis of Interference Factors | 第91-95页 |
·Effect of Attribute Selection Module | 第91-92页 |
·Effect of Pre-processing Module | 第92页 |
·Effect of Cache Memory Size for SVM | 第92-93页 |
·Effect of Penalty Factor –C value | 第93-95页 |
·Conclusion | 第95-96页 |
Conclusion | 第96-98页 |
References | 第98-102页 |
详细摘要 | 第102-108页 |
Acknowledgement | 第108页 |