From 0548e33b5ffa479db8fa5ea52ae27a4401a8c5ba Mon Sep 17 00:00:00 2001
From: erik <erik@cressdna.lab.siobain.com>
Date: Wed, 9 Aug 2017 14:16:39 -0400
Subject: add new website files

---
 cgi-bin/SVM_linear_aa_clf.pkl           | Bin 0 -> 187597 bytes
 cgi-bin/UniqRepsGemys_6089_StSCALER.pkl | Bin 0 -> 980 bytes
 cgi-bin/classifier.py                   |  52 ++++++++++++++++++++++++++++++++
 3 files changed, 52 insertions(+)
 create mode 100644 cgi-bin/SVM_linear_aa_clf.pkl
 create mode 100644 cgi-bin/UniqRepsGemys_6089_StSCALER.pkl
 create mode 100755 cgi-bin/classifier.py

(limited to 'cgi-bin')

diff --git a/cgi-bin/SVM_linear_aa_clf.pkl b/cgi-bin/SVM_linear_aa_clf.pkl
new file mode 100644
index 0000000..1afce0a
Binary files /dev/null and b/cgi-bin/SVM_linear_aa_clf.pkl differ
diff --git a/cgi-bin/UniqRepsGemys_6089_StSCALER.pkl b/cgi-bin/UniqRepsGemys_6089_StSCALER.pkl
new file mode 100644
index 0000000..3a098bd
Binary files /dev/null and b/cgi-bin/UniqRepsGemys_6089_StSCALER.pkl differ
diff --git a/cgi-bin/classifier.py b/cgi-bin/classifier.py
new file mode 100755
index 0000000..fee11b9
--- /dev/null
+++ b/cgi-bin/classifier.py
@@ -0,0 +1,52 @@
+#!/home/erik/bin/python3.6m
+
+#import packages to be used
+from sklearn.svm import SVC
+from sklearn.feature_extraction.text import CountVectorizer
+from sklearn.preprocessing import StandardScaler
+from sklearn.externals import joblib
+import cgi, cgitb
+
+cgitb.enable()
+form=cgi.FieldStorage()
+if form.getvalue('fasta'):
+	alignment = form.getvalue('fasta')
+	alignment=[alignment]
+	name=form.getvalue('seqname')
+	size=len(alignment[0])
+else:
+	alignment = ["MPSKKSGPQPHKRWVFTLNNPSEEEKNKIRELPISLFDYFVCGEEGLEEGRTAHLQGFANFAKKQTFNKVKWYFGARCHIEKAKGTDQQNKEYCSKEGHILIECGAPRNQGKRSDLSTAYFDYQQSGPPGMVLLNCCPSCRSSLSEDYYFAILEDCWRTINGGTRRPI"]
+	name='demo'
+	size=len(alignment[0])
+	
+html = open("./var/www/html/CRESSresults.html")
+page=html.read()
+
+
+AAs=['a','c','d','e','f','g','h','i','k','l','m','n','p','q','r','s','t','v','w','y']
+clf=joblib.load("./cgi-bin/SVM_linear_aa_clf.pkl")
+StSc=joblib.load("./cgi-bin/UniqRepsGemys_6089_StSCALER.pkl")
+cv=CountVectorizer(analyzer='char',ngram_range=(1,1),vocabulary=AAs)
+
+
+#initialize text data vectorizer
+
+dataVect=cv.transform(alignment)
+ 	
+#Scale the data to the training set
+X=StSc.transform(dataVect.astype("float64"))
+
+#make predictions for the original dataset
+results=",".join([name,clf.predict(X)[0]])
+results=",".join([results,str(size)])
+#for i in results:
+	#print(i[0],"\t",i[1])
+
+output = page.format(prediction=results)
+"""f=open('test.html','w')
+f.write(output)
+f.close()"""
+print (output)	
+
+	
+quit()
\ No newline at end of file
-- 
cgit v1.3