30/09/2018, 18:59

chạy code python nay khong duoc ai chyaj dươc giúp em với

chạy nó báo lỗi nhiều qua e ko thể nào biết cách khắc phục ai chạy được chỉ e với ạ

-- coding: utf-8 --

Created on Thu Sep 17 16:09:21 2015

@author: Dipayan

from pandas import Series, DataFrame
import pandas as pd
import numpy as np
import nltk
import re
from nltk.stem import WordNetLemmatizer
from sklearn.svm import LinearSVC
from sklearn.metrics import classification_report
import sklearn.metrics
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn import grid_search
from sklearn.linear_model import LogisticRegression

A combination of Word lemmatization + LinearSVC model finally pushes the accuracy score past 80%

traindf = pd.read_json("…/input/train.json")
traindf[‘ingredients_clean_string’] = [’ , ‘.join(z).strip() for z in traindf[‘ingredients’]]
traindf[‘ingredients_string’] = [’ ‘.join([WordNetLemmatizer().lemmatize(re.sub(’[^A-Za-z]’, ’ ', line)) for line in lists]).strip() for lists in traindf[‘ingredients’]]

testdf = pd.read_json("…/input/test.json")
testdf[‘ingredients_clean_string’] = [’ , ‘.join(z).strip() for z in testdf[‘ingredients’]]
testdf[‘ingredients_string’] = [’ ‘.join([WordNetLemmatizer().lemmatize(re.sub(’[^A-Za-z]’, ’ ', line)) for line in lists]).strip() for lists in testdf[‘ingredients’]]

corpustr = traindf[‘ingredients_string’]
vectorizertr = TfidfVectorizer(stop_words=‘english’,
ngram_range = ( 1 , 1 ),analyzer=“word”,
max_df = .57 , binary=False , token_pattern=r’w+’ , sublinear_tf=False)
corpusts = testdf[‘ingredients_string’]
vectorizerts = TfidfVectorizer(stop_words=‘english’)

predictors_tr = tfidftr

targets_tr = traindf[‘cuisine’]

predictors_ts = tfidfts

#classifier = LinearSVC(C=0.80, penalty=“l2”, dual=False)
parameters = {‘C’:[1, 10]}
#clf = LinearSVC()
clf = LogisticRegression()

classifier = grid_search.GridSearchCV(clf, parameters)


testdf[‘cuisine’] = predictions
testdf = testdf.sort(‘id’ , ascending=True)

testdf[[‘id’ , ‘ingredients_clean_string’ , ‘cuisine’ ]].to_csv(“submission.csv”)

Lê Đình Huy viết 21:12 ngày 30/09/2018
Làm sao để có thể hiển thị syntax highlighting bằng markdown? Các bạn phải đánh dấu ``` như ví dụ dưới đây Chú ý, dấu ``` được tạo ra bởi nút nằm bên trái số 1 trên bàn phím, nút này sẽ là ~ khi bấm giữ Shift Ví dụ cho C Nội dung: ``` void main() { } ``` Và đừng quên ``` ở cuối Kết quả void main() { } Ví dụ cho Pascal Nội dung: ``` Program HelloWorld; Begin WriteLn('Hello world!') {no ";" is required after the last statement of a block - adding one adds a "null stateme…
Bài liên quan