티스토리 뷰

Developer/Weka

[Weka] WEKA의 입력 데이터 형식

데브포유 2011. 5. 11. 11:36
반응형

WEKA의 데이터 det 빌드하기

데이터를 WEKA로 로드하려면 이해가 되는 형식으로 입력해야 한다. 데이터를 로드하기 위해 WEKA가 선호하는 방법은 로드되는 데이터의 유형을 정의하고 데이터 그 자체를 공급할 수 있는 ARFF(Attribute-Relation File Format)이다. 파일에서 각 열을 정의하고 그 내용을 정의한다. 회귀 모델의 경우에는 NUMERIC 또는 DATE 열로 제한된다. 마지막에 데이터의 각 열을 콤마로 한계를 정한 형식으로 공급한다. WEKA로 사용할 ARFF 파일이 아래에 표시된다. 필자의 주택이 데이터 행에서 빠져 있음을 주목하라. 여기에서는 모델을 작성하는 것이므로, 

-- Sample .det File --
@RELATION house

@ATTRIBUTE houseSize NUMERIC
@ATTRIBUTE lotSize NUMERIC
@ATTRIBUTE bedrooms NUMERIC
@ATTRIBUTE granite NUMERIC
@ATTRIBUTE bathroom NUMERIC
@ATTRIBUTE sellingPrice NUMERIC

@DATA
3529,9191,6,0,0,205000
3247,10061,5,1,1,224900
4032,10150,5,0,1,197900
2397,14156,4,1,0,189900
2200,9600,4,0,1,195000
3536,19994,6,1,1,325000
2983,9365,5,0,1,230000

파일에 관계와 데이터 형식을 정의하는 ARFF 파일 형식으로 만들면 WEKA에서 바로 사용할 수 있습니다.

[출처]  http://www.ibm.com/developerworks/kr/library/os-weka1/index.html

반응형