Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1598-5504(Print)
ISSN : 2383-8272(Online)
Journal of Agriculture & Life Science Vol.53 No.6 pp.65-74
DOI : https://doi.org/10.14397/jals.2019.53.6.65

Mapping Species-Specific Optimal Plantation Sites Using Random Forest in Gyeongsangnam-do Province, South Korea

Eun-Jung Park1, Joon-Hyung Park2, Hyung-Ho Kim1*
1Department of Forest Resources, Gyeongsang National University (Institute of Agriculture & Life Science), Jinju, 52828, Korea
2Forest Biomaterials Resources Research Center, Jinju, 52817, Korea
Corresponding author: Hyung-Ho Kim Tel: +82-55-772-1857 Fax: +82-55-772-1859 E-mail: khh@gnu.ac.kr
October 10, 2019 ; November 5, 2019 ; November 18, 2019

Abstract


The purpose of this study is to examine the applicability of the random forest technique, which is recently used for classification prediction. In other words, we will introduce the random forest technique and make a map the species-specific optimal plantation sites. As a result, the accuracy of prediction was 89.29% for Larix kaempferi and 73.89% for Chamaecyparis obtusa. In terms of variable importance, both species showed high influence in the order of DEM, slope, and aspect, and showed low influence in the order of topography, soil texture and soil type. According to the results of the mapping species-specific optimal plantation sites, most regions except for the central part of Gyeongsangnam-do province were judged to be high and moderate suitability of L. kaempferi. The northeastern part of Gyeongsangnam-do province was judged to be high suitability of C. obtusa. The random forest is expected to be highly applicable to various types of classification and prediction studies that have been applied in the forest field as well as the mapping species-specific optimal plantation sites.



랜덤포레스트를 이용한 낙엽송과 편백의 적지적수도 제작: 경상남도를 대상으로

박 은정1, 박 준형2, 김 형호1*
1경상대학교 산림환경자원학과(농업생명과학연구원)
2국립산림과학원 산림바이오소재연구소

초록


본 연구의 목적은 적지적수 판단에 있어 최근 분류 예측에 활용되고 있는 랜덤포레스트 기법의 적용 가능성을 살펴보는데 있다. 즉, 수종별 조림 적지 판단에 있어 랜덤포레스트 기법을 소개하고 적지적수 도를 작성하여 적용성을 판단하고자 한다. 그 결과 랜덤포레스트 기법의 예측 정확도는 낙엽송 89.29%, 편백 73.89%로 높은 편으로 나타났다. 변수 중요도는 두 개의 수종 모두 표고, 경사, 방위의 순으로 영향력이 높은 것으로 나타났으며 지형, 토성, 토양형이 낮은 영향력을 보였다. 적지적수도 작 성 결과, 낙엽송은 경상남도 중부를 제외한 대부분 지역이 가능지와 적지로 나타났으며, 편백은 경상남 도의 북동부 지역이 적지로 나타났다. 랜덤포레스트 기법은 적지적수도 작성뿐만 아니라 산림 분야에서 적용되어 왔던 다양한 형태의 분류 및 예측 연구에서 활용 가능성이 높을 것으로 사료된다.



    서론

    우리나라 산림은 일제강점기와 한국전쟁 등을 겪으며 사람이 접근하기 어려운 지역을 제외한 국 토의 대부분이 황폐해짐에 따라 산림녹화의 필요 성을 절실하게 느끼게 되었다. 1970년대에는 치산 녹화계획을 달성하기 위해 은사시나무, 리기다소나 무 등과 같은 속성수를 적지적수를 고려하지 못한 채 조림하였고, 1980년대에 경제림 조성을 통한 산림경영기반 구축을 위해 산림사업을 진행하였다 (National Institute of Forest Science, 2009). 이러 한 과정을 거친 뒤, 현재는 효과적인 경제림 조성을 위해 적지적수에 대한 노력과 관심이 증가하였다.

    적지적수란 알맞은 땅에 알맞은 나무를 골라 심 는 것을 말하며 수확량을 높이기 위해 가장 적합 한 수종을 선정하여 식재하는 것을 말한다(Rural Development Administration, 2019;National Institute of Korean LanguageL, 2019). 식재의 성공 여부는 시간의 흐름에 따라 개별 수종의 생장 특성에 의해 나타나는 것으로 임분의 입지인자나 지 형인자, 기후인자 등 여러 인자들의 복합적인 영향 을 받는 임목에 대한 정확한 적지분석은 쉽지 않다 (Kim & Chung, 2001). 그렇기 때문에 현재의 임지 상황을 객관적으로 파악하고 임지 생산력을 평가하 기 위한 과학적인 분석기법이 필요하다.

    적지적수 판단 기준은 임지의 생산력을 의미하는 지위지수가 주로 사용되며 이는 대체적으로 회귀기 법을 통해 최적 변수를 선정하여 산출된다(Kim et al., 2006;National Institute of Forest Science, 2009; Moon et al., 2015). 회귀분석은 수치 데이 터를 모형화하기 위한 가장 일반적인 접근법이며, 거의 모든 데이터의 모형화가 가능하고 독립변수가 종속변수에 미치는 영향의 추정이 가능하다(Lee, 2002). 그러나 회귀분석은 적지에 영향을 미치는 인 자들의 영향력 측정이 가능하지만 단편적인 추정 방 식으로 적지 분류에서는 적합한 방법은 아니다.

    분류는 종속변수가 나눠진 계급 중 하나의 계급에 속할 때 주어진 독립변수에 대해 종속변수가 어느 계급에 속할지를 예측하는 것으로(Moon, 2018), 최 근 기계학습 분야에서 인식 성능이 가장 뛰어난 알 고리즘 중 하나로 평가받고 있는 랜덤포레스트 알고 리즘(RF: Random forest algorithm)이 적지분류에 적절한 분류 기법으로 주목받고 있다(Carvalho et al, 2017). 분류 모형에 있어 주로 사용된 기법인 다중회귀분석(Multiple regression analysis)과 RF 를 비교하자면 R2, SR (Sales ratio), MAPE(Mean absolute percentage error), COD (Coefficient of dispersion)와 같은 성능 측정에서 RF가 더 유의한 값 을 나타내었고(Ceh et al. 2018), RMSE (Root mean square error), SD (Standard deviation), Rp (Pearson correlation coefficient), Rs (Spearman correlation coefficient)에 의해 RF가 예측력이 높은 것으로 보 고된 바 있다(Li et al. 2014). 회귀분석은 주어진 자료에 대해서만 예측하고 판단하는 것이라면 RF는 주어진 데이터에서 변수를 무작위로 추출하여 모집 단에 가까울 정도로 복제하기 때문에 더 좋은 일반 화 성능을 가져 정확도가 높은 것으로 사료된다.

    국내 산림분야에서 RF의 활용은 Lee (2018)는 RF 를 이용하여 국내 소나무 재선충병 발생 여부를 판 단하고 이를 바탕으로 발생위험도를 산출한 바 있으 며, Park et al. (2013)이 해충 공격에 대한 나무와 숲의 위험을 등급화하고 생태변수의 예측에 RF가 효과적인 것을 밝혔다. 아직 국내의 적지분류 연구 에서 활용되지 못한 상황이지만, 해외 사례를 참고 해볼 때 RF의 정확도 높은 예측력은 우리나라 분포 수종의 적지 판정에 있어서 활용 가능성이 무궁무진 할 것으로 보인다.

    본 연구에서는 적지분류에 있어서 최신 기법인 RF 의 활용도를 높이기 위해 우리나라 산림의 적지분석 에서 RF의 적용성을 검토하기 위해 경남지역에 분포 하는 낙엽송과 편백의 적지적수도를 제작하였다.

    재료 및 방법

    1 랜덤포레스트 알고리즘(Random Forest Algorithm)

    RF는 Breiman (2001)에 의해 개발된 기법으로 의 사결정나무 기법 중 CART 알고리즘과 앙상블 모 형 중 배깅 알고리즘을 혼합한 알고리즘이다. CART 알고리즘을 기반으로 데이터를 분류하여 변수 선정 에 자유롭고, 배깅 알고리즘을 통해 과대적합을 하 지 않으며 특정한 변수로 편향된 모형이 만들어지는 것을 방지하는 것으로 알려져 있다(Hastie et al, 2009;Louppe, 2014). RF는 여러 개의 의사결정나 무를 만들고 다수결의 결과로 최적의 모형을 도출 하는 방법으로, 주어진 데이터에 일반적인 배깅 알 고리즘과 다르게 모든 변수가 아닌 m개의 독립변 수를 무작위로 선정하여 여러 개의 샘플 데이터 세 트를 복원 추출한다. 영향력이 높은 변수와 낮은 변수에 상관없이 무작위로 선택하기 때문에 샘플 데이터 세트에서 각 모형의 상관성을 제거하여 평 균 변동성이 감소하여 안정적으로 된다. k개의 샘 플 데이터 세트에서 CART 알고리즘을 적용하여 각 각의 모형을 생성하고 단순 다수결을 통해 최적의 최종 모형을 산출한다. 이 랜덤포레스트 과정에서 전체 학습 데이터 셋에서 2/3이 샘플링 되며 나머 지 1/3의 데이터 샘플을 OOB 샘플이라고 한다. OOB 샘플로 최종 모형을 검증가능하며 학습데이터 와 검증데이터의 차이로 오차율을 산출하여 모형의 안정성을 판단한다(Fig. 1).

    2 대상수종 및 생육특성

    대상 수종은 산림청의 조림 권장 수종 중 낙엽송 과 편백을 대상으로 하였다. 낙엽송은 낙엽침엽교목 으로 온대북부와 중부, 남부의 표고 200~1,200m에 서 잘 자라며, 산록 이하 완경사지의 하강사면, 토심 은 70cm이상, 배수가 양호한 사양토~양토, 적윤~ 약습의 갈색산림토양에서 생장이 왕성하다(National Institute of Forest Science, 2009;National Institute of Forest Science, 2012a). 경기도 지역 을 중심으로 강원도, 충청도, 경상북도 지역에 많은 분포를 보이며 전라도와 경상남도에서는 비교적 적 은 분포를 보인다(National Institute of Forest Science, 2014). 편백은 상록침엽교목으로 내한성이 약해 온대남부(전남 장성 이남) 및 난대지역 표고 500m 이하에서 잘 자란다. 토양습도가 적당하고 비 옥한 사질양토에서 생육이 왕성하며, 토심은 60 cm 이상, 바람에 노출이 적은 평행 및 오목사면이 양호 한 적지이다(National Institute of Forest Science, 2009;National Institute of Forest Science, 2012b). 주로 남해안을 따라 식재되어 있으며 전라 남도, 경상남도 일부 지역에 분포하며 섬진강 하류 일부에 분포하고 있다(National Institute of Forest Science, 2014).

    3 자료 수집

    적지적수 평가를 위해서 산림입지토양도(1:5,000), 수치표고모형(DEM)과 한국임업진흥원에서 제공한 2015~2017년 동안 작성된 맞춤형조림지도의 현지 조사자료에 기초하여 분석에 필요한 자료를 작성하 였다. 산림입지토양도는 2009년부터 산림공간정보 로서 국가공간정보체계 구축사업과 연계를 위해 대 축척화 된 1:5,000의 산림입지토양도(Korea Forestry Promotion Institute, 2019)를 활용하였고, 수치표 고모형은 10 m 간격으로 제작하여 분석에 활용하였 다. 현지 조사 자료는 경상남도, 경상북도, 광주광 역시, 대전광역시, 부산광역시, 세종특별자치시, 울 산광역시, 전라남도, 전라북도, 충청남도에서 조사된 낙엽송 표준지 938개소, 편백 표준지 1,088개소이 며, 조사자료 중 임령과 수고 측정치를 이용하였다.

    Table 1에 따르면, 낙엽송은 평균 임령이 36으로 5~65년까지 분포하는 것으로 나타났으며, 평균 수 고는 17.9m로 0.8~34.3m까지 분포하는 것으로 나 타났다. 편백은 평균 임령이 29년으로 3~68까지 분 포하는 것으로 나타났으며, 평균 수고는 11.8m로 0.3~22.1m까지 분포하는 것으로 나타났다.

    4 수종별 지위지수 추정식 개발

    본 연구의 지위지수는 한국임업진흥원의 맞춤형조 림지도 현지 조사 자료를 활용하여 지위지수 추정모 형을 개발하였다. 분석 모형은 국내외 많은 연구자 들의 검증을 거친 Chapman-Richards 수고 추정 모형을 적용하였고, 식 (1)과 같다(Shin et al., 2007; Lee et al., 2014).

    H d o m = a ( 1 e b · A g e ) c
    식 (1)

    여기서 Hdom 은 우세목의 수고이며, Age는 임령, a~c는 모형의 모수이다. 비선형 회귀분석으로 a~c 의 모수를 추정 후 곡선유도법을 통해 지위지수 분 류곡선을 유도하였으며 식 (2)와 같다(Robert et al., 2006).

    S I = H d o m · [ ( 1 e b · 30 ) ( 1 e b · A g e ) ] c
    식 (2)

    5 분석자료 구축

    적지 판정 모형 분석에는 현지 조사자료와 산림입 지토양도를 활용하였다. 우선 학습자료의 종속변수 는 현지조사자료에 대해 추정된 지위지수 분류곡선 을 활용하여 표본점별 지위지수를 추정하였고, 지위 지수를 상, 중, 하 3등급으로 분류하여 최적지(High suitability), 조림 가능지(Moderate suitability), 부 적지(Not suitability)로 명명하였다.

    독립변수 자료추출을 위해 활용된 산림입지토양도 에는 모암, 기후대, 지형, 사면위치, 경사형태, 토 심, 토성, 토양형 인자로 구성된 8개의 토양인자가 있으며, 이 중 토성과 토양형은 다양하게 분류되어 있어 그룹화 하였다. USDA (1999)의 조사기준에 따 라 토성은 7개 토성그룹 중 우리나라 산림 토양에서 주로 나타나는 토성 8가지에 해당하는 3개 그룹(사 질, 사양질, 식양질)으로 구분하였다. 또한 산림토양 형은 주요 입지환경인자와 토양단면인자를 종합적으 로 판단하여 총 28개의 토양형으로 분류되며, 분석 을 위해 갈색산림토양, 적색계갈색산림토양, 적색산 림토양, 암적색산림토양, 그 외 토양의 5개의 토양 군으로 재분류하였다(National Institute of Forest Science, 2011).

    최종적으로 학습자료로 활용한 변수 중 종속변수 는 현지 조사자료의 3등급으로 분류된 지위지수이 며, 독립변수는 산림입지토양도의 모암, 지형, 사면 위치, 경사형태, 토심, 토성, 토양형 인자로 구성된 7개의 토양인자 및 표고, 경사도, 방위 등 10개 변 수에 대해 각각 분석용 코드를 부여하여 데이터를 정비하였다(Table 2).

    예측자료는 경남지역에서 일정한 100m 간격의 정 규 포인트를 추출하여 경남지역 산림입지토양도에서 학습자료와 동일한 방법으로 10개의 독립변수 자료 를 구축하였다. 입지인자나 지형인자가 존재하지 않 는 지역의 포인트는 삭제하여 총 661,255개의 예측 자료를 추출하였다.

    6 적지 판정 및 적지적수도 작성

    구축된 두 수종의 학습자료를 활용한 적지 판정 모형 분석은 2~5개 독립변수 채택 수(mtry)와 300~600개 의사결정나무(ntree)를 조합하여 총 16개의 학습모형을 구축하였고, 그 중 모형검증 과 정을 통해 오차율이 가장 낮은 모형을 선정하여 예 측자료에 적용하였다.

    모형 검증은 평균 예측 오차인 OOB (Out of bag) 샘플로 최종 모형을 검증하며 학습데이터와 검증데 이터의 차이로 오차율(Error rate)을 산출하여 모형 의 안정성을 판단하는데 0에 가까울수록 분류 오류 가 적다는 것을 의미한다. 이는 나무의 개수(ntree) 와 의사결정나무에서 사용될 변수의 개수(mtry)에 의해 값이 달라진다(Breiman, 2001). 또한 RF 과정 에서 불순도 감소량에 따른 각 변수의 중요도를 알 수 있다(Choi & Seo, 1999).

    최종학습모형을 661,255개의 예측자료에 적용하 여 경상남도의 적지적수도를 작성하였다. 분석 프로 그램은 R.3.1.1을 기반으로 한 R-Studio 프로그램 (R-Tools Technology, Inc., 2011)과 ArcView 3.3 (ESRI, 1995), QGIS 3.0.2(QGIS 개발팀, 2002), Arcgis 10.3(ESRI, 1999)을 활용하여 제작하였다.

    결과 및 고찰

    1 지위지수 분류곡선 추정

    수종별 임령 및 우세목 수고 측정치를 이용하여 우 세목 수고 생장모형의 모수를 추정하였다(Table 3). 낙엽송의 우세목 수고 생장모형의 설명력(R2)은 0.441로 나타났고, 편백은 0.677로 나타났으며, 추정된 모형을 이용하여 낙엽송과 편백의 지위지 수를 산정하였다.

    두 수종의 우세목수고 생장모형은 곡선유도법을 이용하여 지위지수 분류곡선으로 유도하였고, 기준 임령 30년에 대한 지위지수는 낙엽송이 12~24까지, 편백은 10~20까지 분포하는 것으로 나타났다. 낙엽 송 조림 적지의 지위지수 20 이상, 부적지는 지위지 수 16 미만으로 분류하였고, 편백은 지위지수 16 이 상을 조림적지로, 지위지수 12 미만을 부적지로 구 분하였다(Table 4).

    2 학습 결과

    각 표본점 자료에 지위급에 따른 조림 적지등급을 3등급으로 나누어 조림 적지 평가를 실시하였다. RF의 학습모형 혼동행렬(Confusion matrix)에서 오 차율은 각 수종의 계층오차(class error)의 평균으로 나타나며, 오차율이 가장 낮은 학습모형을 최적학습 모형으로 선정하여 예측자료에 대한 적지분류를 실 시하였다(Table 5). 우선 낙엽송에 최적학습모형의 OOB 오차율은 10.71%로 나타나 이를 역산하면 예 측정확도는 89.29%로 나타났다. 편백은 OOB 오차 율이 26.11%로 이에 따른 예측정확도는 73.89%이 며, 낙엽송의 예측정확도가 상대적으로 높은 것으로 나타났다(Table 6). 직접적인 비교는 어렵지만, 국 내의 조림적지 분석에 주로 활용되는 다중회귀분석 (Multiple regression analysis)에 의한 조림적지 판정모형의 설명력과 비교해 볼 때, 낙엽송의 경우 R2가 0.240이며(Kim et al., 2012), 편백은 R2가 0.486임을 고려하면(Kang et al., 2015) 두 수종 모두 상대적으로 높은 수준의 예측정확도를 보이는 것으로 사료된다.

    RF의 가장 큰 특징은 분류에 활용되는 변수중요 도가 도출되는 것이다(Table 7). 낙엽송의 변수중 요도는 표고의 노드 불순도 감소량이 176.4으로 가 장 높게 나타났으며, 경사(91.9), 사면방위(67.8), 사면위치(40.4), 암노출도(35.3) 순으로 높은 영향 을 미치는 것으로 분석되었고, 토성이 3.0으로 가 장 낮은 중요도를 보였다. 낙엽송의 조림적지는 표 고 100~1,100m이고, 온대남부 해안, 표고 200m 이상에서 생장이 우수하며, 토심이 깊은 곳이 적지 로 알려져 있으므로(National Institute of Forest Science, 2012), 본 연구에서 표고와 사면방위 및 사면위치가 중요 인자로 분류된 것이 타당한 결과로 사료된다. 또한 기존의 낙엽송의 조림적지 판정모형 에서 채택된 입지변수는 사면방위, 유효토심, 및 경 사이며(Kim et al., 2012), 본 연구의 결과의 경사 와 사면방위가 주 영향인자로 평가된 것과 일치한 결과를 보였다.

    편백의 변수중요도는 표고의 노드 불순도 감소량 이 143.9으로 가장 높았고, 경사(86.2), 사면방위 (60.6), 암노출도(36.0), 토심(31.9) 등이 중요도가 높게 나타났다. 일반적으로 편백의 조림적지에 있어 서 주요 입지조건은 지형이 가파르고 험준한 암석지 에서 생육이 불량한 것으로 알려져 있으며, 표고 300m 이하의 산복부의 토심이 깊은 지역에서 생육이 양호한 것으로 보고된 바 있고(National Institute of Forest Science, 2012), 완경사지의 하향상면에서 지위가 높은 것으로 알려져 있다(National Institute of Forest Science, 2009). 이러한 편백 조림적지의 특성을 고려해 볼 때, 표고와 경사, 사면방위 및 암 노출도, 토심 등의 변수가 적지 분류에 있어서 중요 도가 높게 나타난 것으로 판단된다.

    4 적지적수도 작성

    수종별 OOB 오차율이 가장 낮은 최적의 RF 학습 모형을 선정하여 경상남도 예측자료를 적용하였다. 적지 분석 결과를 도출하여 낙엽송과 편백의 적지면 적 산출 및 적지적수도를 작성하였다(Fig. 2).

    낙엽송의 경상남도 적지적수도 분석결과, 적지 면 적은 75,345ha로 사천 동부, 산청 남부, 진주 동부, 창녕 동북부, 함안 북부, 하동 남부 위주이며, 경상 남도 지리산의 임연부와 강 주변이 적지로 나타났 다. 이는 햇빛이 잘 들어오며, 토양이 습윤하고 비 옥한 곳에 잘 자라는 낙엽송의 생육 특성과 일치한 다(Korea National Park Research Institute, 2017). 부적지 면적은 118,109ha 의령, 진주 서부, 합천 위 주로 나타났다.

    편백의 경상남도 적지적수도 분석결과, 적지 면적 은 101,286 ha로 거창, 고성, 김해 서부, 남해, 산 청 중부, 양산, 밀양, 함안 위주로 나타났다. 내한성 이 약해 온대남부 및 난대지역 표고 500 m 이하, 바람에 노출이 적은 평행 및 오목사면에 분포하는 것으로 나타난다. Kang et al. (2015)에 따르면 편 백은 내륙의 표고 400 m 이하인 계곡부 또는 유효 토심이 깊고 유기물함량이 높은 경상남도의 함양, 산청, 합천, 김해가 적지로 나타나, 본 연구의 결과 와 어느 정도 일치하는 경향을 보인다. 부적지 면적 은 197,829 ha 사천 동부, 진주, 창녕 서부, 함안 위주로 나타났다. 편백의 적지 면적이 낙엽송보다 크게 나타났지만, 부적지의 면적 또한 더 크게 나타 난 것을 알 수 있다(Table 8).

    경상남도 낙엽송과 편백의 적지 예측을 위해 산림 입지토양도(1:5,000), 수치표고모형(DEM)과 2015~ 2017년에 조사된 조림지 조사 자료를 바탕으로 RF 를 적용하여 최적 학습모형을 도출하고 적지적수도 를 작성하였다. RF로 적지분류를 실시할 경우 예측 정확도가 높은 결과가 나타난다는 사실을 확인할 수 있었다. 분석에 활용된 적지평가 인자 중 두 수종이 공통으로 표고, 경사, 방위의 순으로 영향력이 높은 것으로 나타났으며, 지형, 토성, 토양형이 주로 영 향력이 떨어지는 것으로 나타났다. 작성된 낙엽송의 적지적수도는 경상남도 중부지역에 부적지가 나타난 것을 제외하면 상당수가 조림 가능지와 조림 적지로 나타났으며, 편백은 경상남도의 북동부 지역이 적지 로 나타났다. 이로써 낙엽송과 편백의 입지・토양환 경인자에 따른 적지와 부적지를 시각적으로 판단할 수 있었고, 기존 문헌의 낙엽송, 편백의 생육환경과 비교하였을 경우에도 수용할 수 있는 결과가 도출된 것으로 사료된다.

    그동안 우리나라 조림적지 분류 연구는 주로 수량 화 분석과 다중회귀분석에 의한 연구가 주를 이루었 다. 하지만 그 한계도 명확하였으므로, 앞으로는 본 연구에서 고려된 RF과 같은 기계학습 알고리즘에 대한 연구를 지속할 필요가 있다. 또한 RF는 적지 적수도 작성뿐만 아니라 산림 분야에서 적용되어 왔 던 분류 및 예측 기법보다 활용 가능성이 높을 것으 로 사료된다.

    Figures

    JALS-53-6-65_F1.gif

    The flowchart of random forest algorithm.

    JALS-53-6-65_F2.gif

    The map of species-specific optimal plantation sites by L. kaempferi (a) and C. obtusa (b).

    Tables

    Summary of used data set for this study

    The description of environmental variables in this study

    The estimated parameters of Chapman-Richard function for L. kaempferi and C. obtusa

    Classification of site index range for L. kaempferi and C. obtusa

    The predicted confusion matrix for L. kaempferi and C. obtusa

    Classification accuracy of optimal learning model used random forest algorithm

    The decrement of nodes impurity by random forest algorithm

    The calculation result of suitability area for L. kaempferi and C. obtusa

    References

    1. Breiman L. 2001. Random Forests. Machine Learning. 45 (1): 5-32.
    2. Carvalho, MC , Gomide LR , dos Santos RM , Scolforo JS . de Carvalhl LMT and de Mello JM. 2017. Modeling ecological niche of tree species in brazilian tropical area. J. of Plant Ecology 11 (6): 803-814.
    3. Ceh M , Kilibarda M , Lisec A and Bajat B. 2018. Estimating the performance of random forest versus multiple regression for predicting prices of the apartments. International J. of Geo-Information 7 (5): 168.
    4. Choi JH. and Seo DS. 1999. Decision Trees and Its Applications. J. of The Korean Official Statistics 4 (1): 61-83.
    5. Hastie T , Tibshirani R and Friedman J. 2009. The elements of statistical learning: Data mining, inference, and prediction (2nd ed.). Springer. pp.745.
    6. Kang SP , Kim JY and An KW. 2015. Site index estimation and suitable-land evaluation of Cryptomeria japonica and Chamaecyparis obtusa: Focused on Jeju Special Self-Governing Province and southern regions. J. of Korean Island 27 (3): 125-144.
    7. Kim DH , Kim EG , Park SB , Kim HG and Kim HH. 2012. Analysis of the effect of climate change on the site index of Larix leptolepis. J. of Korean Forest Society 101 (1): 53-61.
    8. Kim EG , Kim HH and Chung JS. 2006. Development of a GIS application model for analyzing sitespecific suitability and investment efficiency of major plantation species. The Korean Association of Geographic Information Studies 9 (2): 1-10.
    9. Kim HH and Chung JS. 2001. Neural network applications to determining suitable tree species for site-specific conditions. J. of Korean Forest Society 90 (4): 437-444.
    10. Korea Forestry Promotion Institute.2019. https://www.kofpi.or.kr/intro/bizGuide_02_02.do.
    11. Korea National Park Research Institute.2017. Establishment of Softwood Monitoring Base for Management of Larix kaempferi Plantation Area in Taebaeksan National Park. pp.202.
    12. Lee DS. 2018. Development of hazard rating system to pine wilt disease based on environmental factors using a random forest model. Seoul. Kyunghee University.
    13. Lee JM. 2002. A Study on Statistical Regression Analysis. Seoul. Yonsei University. pp.48.
    14. Lee YG , Sung JH , Chun JH and Sin MY. 2014. Effect of climate changes on the distribution of productive areas for Quercus mongolica in Korea. J. of Korean Forest Society 103 (4): 605-612.
    15. Li H , Leung KS , Wong MH and Ballester PJ. 2014. Substituting random forest for multiple linear regression improves binding affinity prediction of scoring functions : Cyscore as a case study. BMC Bioinformatics, 15: 291.
    16. Louppe G. 2014, Understanding Random Forests, University of Liege, Leige, Belgium. pp.211.
    17. Moon GH , Kim YS , Lim JH and Sin MY. 2015. Mapping species-specific optimal plantation sites based on environmental variables in Namwon City, Korea. Korean J. of Agricultural and Forest Meteorology 17 (2): 126-135.
    18. Moon SY. 2018. Performance Comparison of Classification methods based on the random forest in class imbalanced data. Seoul. Korea University.
    19. National Institute of Forest Science.2009. History and Utilized Research of Species-Specific Optimal Plantation Sites. pp.128.
    20. National Institute of Forest Science.2011. Forest Location Soil Map (1:5,000) Production standard Manual. pp.143.
    21. National Institute of Forest Science.2012a. Economic species Hinoki Cypress. pp.155
    22. National Institute of Forest Science.2012b. Economic species Japanese Larch. pp.180
    23. National Institute of Forest Science.2014. Predicting the changes of productive areas for major tree species under climate change in Korea. pp. 240.
    24. National Institute of Korean Language.2019. Right Tree on Right Site. http://stdweb2. korean.go.kr/main.jsp.
    25. Park YS , Chung YJ and Moon YS. 2013. Hazard ratings of pine forests to a pine wilt disease at two spatial scales (individual trees and stands) using self-organizing map and random forest. Ecological Informatics. 13: 40-46.
    26. Robert LM , William KO , Carleton BE. 2006. Site Index Curves for White Fir in the Southwestern United States Developed Using a Guide Curve Method. Western journal of applied Forestry, 21 (2): 87-93.
    27. Rural Development Administration.2019. right tree on right site. http://www.nongsaro.go.kr/portal/ps/psq/psqb/farmTerm.
    28. Shin MY , Won HK , Lee SW and Lee YY. 2007. Site index equations and estimation of productive areas for major pine species by climatic zones using environmental factors. The Korean Society of Agricultural and Forest Meteorology, 9 (3): 179-187.
    29. United States Department of Agriculture (USDA).1999. Soil Taxonomy: A Basic System of Soil Classification for Making and Interpreting Soil Surveys. 2nd Ed. United States Department of Agriculture (USDA). Washington, D.C. U.S.A. pp.871.
    오늘하루 팝업창 안보기 닫기