30/09/2018, 18:59

chạy code python nay khong duoc ai chyaj dươc giúp em với

chạy nó báo lỗi nhiều qua e ko thể nào biết cách khắc phục ai chạy được chỉ e với ạ
code

-- coding: utf-8 --

“”"
Created on Thu Sep 17 16:09:21 2015

@author: Dipayan
“”"

from pandas import Series, DataFrame
import pandas as pd
import numpy as np
import nltk
import re
from nltk.stem import WordNetLemmatizer
from sklearn.svm import LinearSVC
from sklearn.metrics import classification_report
import sklearn.metrics
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn import grid_search
from sklearn.linear_model import LogisticRegression

A combination of Word lemmatization + LinearSVC model finally pushes the accuracy score past 80%

traindf = pd.read_json("…/input/train.json")
traindf[‘ingredients_clean_string’] = [’ , ‘.join(z).strip() for z in traindf[‘ingredients’]]
traindf[‘ingredients_string’] = [’ ‘.join([WordNetLemmatizer().lemmatize(re.sub(’[^A-Za-z]’, ’ ', line)) for line in lists]).strip() for lists in traindf[‘ingredients’]]

testdf = pd.read_json("…/input/test.json")
testdf[‘ingredients_clean_string’] = [’ , ‘.join(z).strip() for z in testdf[‘ingredients’]]
testdf[‘ingredients_string’] = [’ ‘.join([WordNetLemmatizer().lemmatize(re.sub(’[^A-Za-z]’, ’ ', line)) for line in lists]).strip() for lists in testdf[‘ingredients’]]

corpustr = traindf[‘ingredients_string’]
vectorizertr = TfidfVectorizer(stop_words=‘english’,
ngram_range = ( 1 , 1 ),analyzer=“word”,
max_df = .57 , binary=False , token_pattern=r’w+’ , sublinear_tf=False)
tfidftr=vectorizertr.fit_transform(corpustr).todense()
corpusts = testdf[‘ingredients_string’]
vectorizerts = TfidfVectorizer(stop_words=‘english’)
tfidfts=vectorizertr.transform(corpusts)

predictors_tr = tfidftr

targets_tr = traindf[‘cuisine’]

predictors_ts = tfidfts

#classifier = LinearSVC(C=0.80, penalty=“l2”, dual=False)
parameters = {‘C’:[1, 10]}
#clf = LinearSVC()
clf = LogisticRegression()

classifier = grid_search.GridSearchCV(clf, parameters)

classifier=classifier.fit(predictors_tr,targets_tr)

predictions=classifier.predict(predictors_ts)
testdf[‘cuisine’] = predictions
testdf = testdf.sort(‘id’ , ascending=True)

testdf[[‘id’ , ‘ingredients_clean_string’ , ‘cuisine’ ]].to_csv(“submission.csv”)

Lê Đình Huy viết 21:12 ngày 30/09/2018
Làm sao để có thể hiển thị syntax highlighting bằng markdown? Các bạn phải đánh dấu ``` như ví dụ dưới đây Chú ý, dấu ``` được tạo ra bởi nút nằm bên trái số 1 trên bàn phím, nút này sẽ là ~ khi bấm giữ Shift Ví dụ cho C Nội dung: ``` void main() { } ``` Và đừng quên ``` ở cuối Kết quả void main() { } Ví dụ cho Pascal Nội dung: ``` Program HelloWorld; Begin WriteLn('Hello world!') {no ";" is required after the last statement of a block - adding one adds a "null stateme…
Bài liên quan
0