Lee, Oh, Na, Lee, Koo, Jeon, Jeon, Lee, and Hong: Machine Learning-Based Prediction of Annual Growing Degree Days Across South Korea

Yong Ho Lee[1][2]Young Ju Oh[3]Chea Sun Na[4]Dongwook Lee[2]In Gyeong Koo[5]Woo Chan Jeon[5]Weon-Tai Jeon[6]Chung-Kuen Lee[6]Sun Hee Hong[5]

Abstract

Annual growing degree days (GDDs) are widely used to quantify the thermal conditions that affect crop, insect, and weed development. In this study, long-term temperature data (1994–2023) from 96 Korean Meteorological Administration automated weather observation system stations were used to calculate annual GDDs under eight base temperatures (−10 °C to 25 °C) and to develop predictive models. Five regression algorithms [ordinary least squares, ElasticNet, support vector regression (radial basis function), random forest, and light gradient boosting machine (LightGBM)] were evaluated using repeated ShuffleSplit cross-validation. Among these, LightGBM achieved the best performance (R2 = 0.9996, RMSE = 65.3, and MAE = 45.7), exhibiting high accuracy and computational efficiency. The optimized model was applied to gridded climate datasets (MKPRISM v2.1, WorldClim 2.1) and future projections (CMIP6 SSP3-7.0). The results showed consistent spatial patterns across the datasets and a 22% nationwide rise in GDDs in 2046–2055, with the southern coastal and Jeju regions showing the highest increase. The proposed machine learning-based framework enables the efficient high-resolution prediction of annual GDDs under multiple base temperatures without daily accumulation, providing a practical tool for crop management, pest control, and climate-impact assessment in South Korea.

Keyword



INTRODUCTION

기후는 생태계의 구조와 기능, 농업 생산성, 그리고 생물의 발생과 생육을 결정하는 가장 중요한 환경 요인이다. 기후 인자 중 적산온도(Growing Degree Days, GDD)는 일정 기준온도 이상에서 누적된 온도의 합으로 정의되며, 식물·잡초·곤충 등 다양한 생물군의 생장과 발육을 정량적으로 예측하는 대표적인 지표이다 (McMaster and Wilhelm, 1997; Bonhomme, 2000). 특히 적산온도는 작물의 생육단계 예측과 파종·수확 시기 결정 (McMaster and Wilhelm, 1997; Andrews et al., 2021), 잡초의 발아 시기 추정 (Forcella et al., 2000), 곤충의 발생 및 방제 시기 예측 (UC IPM, 2023) 등 농업과 생태 관리 전반에서 폭넓게 활용되고 있다. 이러한 누적 열량 기반 예측은 기후 요인에 따른 생물 반응을 정량화함으로써 농업 생산성과 생태계 관리의 효율성을 향상시키는 데 중요한 역할을 한다.

연적산온도는 기준온도에 대한 일적산온도를 연 단위로 합산한 지표로, 생물의 발육 속도와 생리적 반응을 정량적으로 설명하는 데 널리 활용된다 (McMaster and Wilhelm, 1997; Bonhomme, 2000). 특히 연적산온도는 한 재배기 동안의 열적 환경을 대표하기 때문에, 작물의 생육단계와 숙기 판정, 품종 적응성 평가, 그리고 지역 간 재배 적지 구분 등에 핵심 지표로 사용된다. 예를 들어 포도 재배에서는 연적산온도를 기반으로 한 Winkler 지수 (Winkler et al., 1974)가 품종별 적응 구역을 I–V 등급으로 구분하며, 옥수수·밀 등 주요 작물에서도 연적산온도를 활용해 파종 및 수확 시기, 품종 선택, 예상 생육기간을 결정한다 (Andrews et al., 2021; McMaster and Wilhelm, 1997). 또한 곤충의 세대수(Voltinism)나 발생 피크 시기는 적산온도 임계치와 밀접히 연관되어 있어 해충의 연간 발생권 및 방제 시기 예측에 유용하다 (UC IPM, 2023; Du et al., 2020). 잡초의 발아·개화·종자 성숙 단계 역시 연적산온도로 표준화할 수 있어, 지역 간 방제 시기 비교 및 기후변화에 따른 분포 예측에 활용된다 (Forcella et al., 2000). 국내에서도 찰옥수수의 적정 파종기 산정(Shim et al., 2019), 옥수수의 파종시기별 생육 및 수량 변화(Kim et al., 2017), 보리의 생육단계별 요구열량 및 수량성 분석(Lee et al., 2000; Koo et al., 2001), 벼 해충의 발생 시기 비교(Kim et al., 2019), 가루깍지벌레 월동알의 부화 시기 예찰모형(Jeon et al., 1996) 등 다양한 작물과 해충 관리 연구에 적용되어 왔다. 이처럼 연적산온도는 작물·해충·잡초를 포함한 다양한 생물군의 연간 생육 및 분포 변동을 통합적으로 해석할 수 있는 실용적이고 보편적인 생태 예측 지표로 자리 잡고 있다.

기후의 공간적 분포를 예측하기 위해서는 관측기온을 보간(Interpolation)하거나 격자형 기후자료(Gridded climate data)를 활용하는 접근이 널리 사용되고 있다. 대표적으로 PRISM (Daly et al., 2008), WorldClim (Fick and Hijmans, 2017) 등은 전 지구적 또는 지역 규모의 고해상도 격자형 기온자료를 제공하며, 이를 기반으로 적산온도의 공간적 계산과 시각화가 수행되고 있다. 또한 CMIP6 (Eyring et al., 2016) 및 CORDEX (Giorgi and Gutowski, 2015)와 같은 미래 기후 시나리오를 적용하여 2100년까지의 누적 온도 변화와 이에 따른 생물계 반응을 예측하는 연구도 활발히 이루어지고 있다. 최근에는 국제적으로 USA-NPN에서 0 °C 및 10 °C 기준의 누적 적산온도(AGDD) 격자자료를, 국내에서는 기상청 기후정보포털을 통해 5, 10, 15 °C 기준의 유효적산온도 격자자료를 제공하는 등, 공간 기반 적산온도 정보의 생산과 활용이 전 세계적으로 확대되고 있다 (USA-NPN, 2023; KMA Climate Information Portal, 2024).

그러나 기존의 일별 격자 생성 후 연적산온도 계산 방식은 고해상도 자료에서 연산량이 방대하다는 근본적 한계를 지닌다. 특히 기상청의 국가 기후변화 표준 시나리오인 CMIP6 계열의 기후자료는 일반적인 365일력 대신 비정규 달력(360-day)을 사용하는 경우가 많아, 연도 간 일수 불일치와 시간 좌표 복원 문제가 발생한다 (CF Conventions, 2023). 이러한 제약으로 인해 대규모 격자자료에서 일관성 있는 연적산온도 계산을 수행하기 어렵고, 전처리 과정에서도 상당한 시간과 계산 자원이 소요된다. 특히 기준온도는 생물종과 생육단계에 따라 상이하게 설정되므로, 이를 반영하지 못하면 생리적 반응 예측의 정확성이 떨어진다. 예를 들어, 옥수수는 10 °C 기준으로 생육단계 및 파종·수확 시기를 결정하며 (Andrews et al., 2021), 명아주(Chenopodium album, 2-3 °C)와 붉은명아주(Amaranthus retroflexus, 약 9 °C) 등 잡초 종별로 발아 온도 기준이 다르다 (Steinmaus et al., 2000; Gardarin et al., 2010). 곤충의 경우에도 발육 하한이 종마다 달라, 복숭아심식나방(Cydia pomonella)은 11.1 °C의 임계값을 기준으로 발생 및 방제 시기를 예측한다 (UC IPM, 2023). 이처럼 서로 다른 기준온도별 연적산온도를 산출할 때마다 모든 격자의 연산과 누적합을 반복해야 하는 구조적 비효율성이 발생한다.

이를 극복하기 위해 기초 기후 인자에 기반한 연적산온도 예측모형의 개발이 필요하다. 머신러닝 기반 회귀모형은 다변량 기후 및 지형 변수를 결합하여 복잡한 온도 반응 관계를 학습할 수 있으며 (Breiman, 2001; Zou and Hastie, 2005; Smola and Schölkopf, 2004), 관측소가 제한된 지역에서도 격자형 입력자료만으로 고해상도 예측이 가능하다는 장점이 있다.

본 연구의 목적은 대한민국 기상청 관측자료를 기반으로 기상대별 다양한 기준온도에 대한 연적산온도를 산출하고, 여러 머신러닝 회귀모형(OLS, ElasticNet, SVR, Random Forest, LightGBM)의 예측 성능을 비교·평가하여 최적모형을 도출하는 것이다. 또한 선정된 모형을 대한민국 전역의 격자형 기후자료 및 미래 기후 시나리오(SSP3-7.0)에 적용함으로써, 다양한 기준온도별 연적산온도의 공간 분포를 효율적으로 예측하고자 한다. 이를 통해 복잡한 일 단위 누적 연산 없이도 수요자들이 정확하고 활용도 높은 대한민국 연적산온도 공간데이터를 쉽게 확보할 수 있는 기술적 기반을 제시하고자 한다.

MATERIALS AND METHODS

데이터 수집

본 연구에서는 대한민국 전역의 종관기상관측소(ASOS) 자료를 이용하여 기준온도별 연적산온도를 예측하기 위한 학습데이터를 구축하였다. 기상자료는 기상청 기상자료개방포털(data.kma.go.kr)에서 제공하는 1994-2023(총 30년)동안의 96개 기상대의 일평균기온, 일최저기온, 일최고기온과 기상대별 메타정보를 수집하였다 (Fig 1).

Fig. 1

Locations of the 96 weather stations used for constructing the annual growing degree days prediction model in South Korea

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-f1.png

자료 품질관리를 위해 연속 결측이 3일 이상인 월은 제외하였으며, 3일 미만의 결측은 선형보간법(Linear interpolation)으로 보정하였다. 보정 후에도 연간 자료가 완전하지 않은 기상대-연도 조합은 제거하였다. 이후 각 지점별로 연평균기온, 연평균최저기온, 연평균최고기온을 산출하고, −10, −5, 0, 5, 10, 15, 20, 25°C 총 8개의 기준온도에서 각각 연적산온도를 계산하였다. 연적산온도의 계산식은 다음과 같다.

여기서 GDD는 연적산온도(°C), Tmax, iTmin, i는 i일의 최고·최저기온(°C), Tbase는 기준온도(°C), n은 해당 연도의 일수이다.

최종 학습데이터에는 기상대, 연도 조합(총 14,048개)별로 입력 변수인 기준온도, 연평균기온, 연평균최저기온, 연평균최고기온, 위도, 경도, 목표 변수인 연적산온도가 포함되었다(Table 1).

Table 1

Summary of meteorological and topographic datasets used for machine learning-based prediction of Annual growing degree days in South Korea

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-t1.png

최적 예측 모형의 적용성 시험을 위한 격자형 입력자료는 기상청 기후정보포털(www.climate.go.kr)의 남한상세기후자료(MKPRISMv2.1, 2000-2019, 해상도 30s), CMIP6 기반 국가 기후변화 표준 시나리오 (SSP3-7.0, 2021-2100), 그리고 WorldClim 2.1(1970-2000, 해상도 10 min)을 활용하였다(www.worldclim.org). 모든 자료는 WGS84 좌표체계(EPSG:4326)로 변환하였으며, 국토지리정보원(NGII) 수치표고모형(Digital Elevation Model, DEM, 해상도90 m)는 각 기후자료의 해상도(30초 또는 10분)에 맞추어 평균값 기반의 업스케일링(upscaling) 및 공간 정합(spatial alignment)을 수행하였다(NGII, 2023)

연적산온도 예측모형 구축

본 연구에서는 연적산온도의 최적 예측모형을 선발하기 위하여 선형 모형에서 머신러닝기반 비선형 모형까지 다양한 특성을 지닌 다섯 가지 회귀 모형을 비교하였다: Ordinary Least Squares (OLS), ElasticNet, Support Vector Regressor (SVR, RBF 커널), RandomForest(RF), Light Gradient Boosting Machine (LightGBM) (Table 2).

Table 2

Overview of regression models used for annual cumulative growing degree day prediction

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-t2.png

데이터 분할은 ShuffleSplit 기반 반복 교차검증 방식을 사용하였다. 총 데이터를 무작위로 5회 반복하여 학습 세트(80%)와 검증 세트(20%)로 분할하였다.

입력 변수는 학습 세트의 평균과 표준편차를 기준으로 표준화(Standardization) 하였으며, 동일한 변환이 검증 세트에 적용되도록 하여 검증 세트의 정보가 학습 과정에 유출되는 정보 누수(leakage)를 방지하였다.

각 회귀 모형의 하이퍼파라미터는 내부 교차검증을 통해 최적 조합을 탐색하였으며, 획득한 설정값은 해당 반복 내의 모든 학습과 평가에 일관되게 적용되었다.

성능 평가는 세 가지 지표, 결정계수 (R²), 평균제곱근오차 (Root Mean Square Error, RMSE), 평균절대오차 (Mean Absolute Error, MAE)를 사용하였다. 각 모형의 반복별로 산출된 지표의 평균값과 표준편차를 최종 성능 결과로 비교하였다.

연적산온도 예측모형 적용

최종 선정된 최적 연적산온도 예측 모형을 파일 형태(.pkl)로 추출하여 활용하였으며 예측 모형은 실제 공간 자료에 적용하여 대한민국 연적산온도의 공간 분포를 예측하고 모형의 적용성을 검증하였다. 일반적으로 GIS 기반의 격자 자료에는 위도·경도 정보가 이미 포함되어 있으므로 연평균기온, 연평균최저기온, 연평균최고기온, 그리고 고도(DEM) 격자 자료를 모형 입력으로 하면 본 연구에서 개발된 예측모형을 활용하여 연적산온도 격자 자료를 산출할 수 있다(Fig 2).

Fig. 2

Schematic workflow for estimating annual growing degree days using the machine learning-based prediction model

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-f2.png

연적산온도 예측의 적용성을 검증하기 위하여 여러 기준온도에 대한 비교, 두 가지의 격자 해상도(30초 격자, 10분 격자)에 대한 적용, 현재(2000-2010)와 미래 시나리오(SSP3-7.0, 2046-2055년) 적산온도 예측을 수행하고 현재와 미래의 연적산온도를 활용한 해바라기의 재배적지 변동예측을 수행하였다. 이를 통해 본 연구에서 개발한 모형이 다양한 해상도와 기준온도 조건의 적산온도 예측과 농업, 생태적 연구에 활용될 수 있음을 확인하였다.

분석도구

본 연구의 데이터 전처리 및 적산온도 계산은 R (v4.3.2) 환경에서 수행하였다. 사용된 주요 패키지는 dplyr(데이터 필터링 및 요약), tidyr(데이터 구조 변환), readr(입력·출력 관리), lubridate(날짜·시간 처리), zoo(시계열 보간 및 누적 연산) 등이다. 이 조합을 통해 일 단위 기온자료를 정리하고, 기준온도별로 누적 적산온도를 계산한 후, 연단위 및 격자단위로 집계된 학습 자료를 생성하였다. 회귀모형 구축과 예측, 교차검증 및 시각화는 Python (v3.10) 환경에서 수행하였다. 주요 패키지는 pandas(데이터 처리), numpy(수치 연산), scikit-learn(회귀모형 구현 및 성능평가), lightgbm(Gradient Boosting 기반 비선형 회귀모형 학습), matplotlib(시각화) 등이다. 이 도구를 활용하여 다양한 회귀모형(OLS, ElasticNet, SVR, RF, LightGBM)의 성능을 비교하고, 최적모형을 선정하여 적산온도의 공간적 분포를 예측하였다.

RESULTS AND DISCUSSION

연적산온도 예측 최적모형의 선발과 성능

연적산온도의 예측을 위해 총 다섯 가지 회귀모형의 성능을 비교하였다(Table 3). 비교 대상에는 선형모형인 OLS, 정규화 기반의 ElasticNet, 비선형 커널 기반의 SVR, 그리고 앙상블 기반의 RF 및 LightGBM이 포함되었다.

Table 3

Performance comparison (Average ± SD) of regression models for annual growing degree days prediction

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-t3.png

모형별 교차검증 결과, LightGBM과 RF가 매우 우수한 예측 성능을 보였으나, RF (R² = 0.9995, RMSE = 72.1, MAE = 48.9)에 비해 LightGBM (R² = 0.9996, RMSE = 65.3, MAE = 45.7)이 가장 높은 설명력과 가장 낮은 오차를 보여 최적 예측모형으로 선정되었다. 또한 예측값과 실제값의 차이도 뚜렷한 경향성 없이 전 구간에서 균등하게 분포하여 높은 예측 정밀도를 보였다(Fig. 3 D-E).

Fig. 3

Comparison of predicted and observed annual growing degree days (GDD) using five regression models: ordinary least squares (OLS), ElasticNet, support vector regressor (SVR), random forest, and light gradient boosting machine (LightGBM)

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-f3.png

RF와 LightGBM은 모두 다수의 결정트리를 결합하여 예측 성능을 향상시키는 앙상블(ensemble) 기반 비선형 회귀모형이지만, 트리를 결합하는 방식과 학습 전략에서 차이를 가진다. RF는 다수의 트리를 병렬적으로 학습시킨 뒤 각 트리의 예측값을 단순 평균하여 최종 결과를 도출한다(Breiman, 2001). 이 방식은 분산을 줄이고 과적합을 방지하는 데 유리하지만, 개별 트리의 학습이 서로 독립적이기 때문에 학습 속도가 상대적으로 느리고 예측 정밀도 향상에는 한계가 있다. 특히 변수 간 상호작용이 복잡하거나 데이터 분포가 비선형적인 경우, 평균화 과정에서 세밀한 패턴이 희석되는 경향이 나타난다.

반면 LightGBM은 부스팅기반 알고리즘으로, 이전 트리의 오차를 반복적으로 보정하면서 점진적으로 성능을 향상시킨다(Ke et al., 2017). 또한 트리 확장 시 전통적인 깊이 우선 성장(depth-wise) 대신 리프(leaf-wise) 성장 방식을 사용함으로써, 오차 감소가 가장 큰 노드부터 효율적으로 분할하여 더 높은 예측 정밀도를 달성한다. 이러한 구조적 특징 덕분에 동일한 데이터셋에서 더 적은 수의 트리로도 높은 정확도를 확보할 수 있으며, 학습 속도와 메모리 효율성 또한 향상된다. 다만 LightGBM은 학습률(learning rate), 정규화 계수(λ1, λ2), 최대 깊이(max depth) 등 하이퍼파라미터 설정에 민감하며, 데이터가 매우 작거나 이상치(outlier)가 많은 경우에는 과적합 위험이 존재할 수 있다. RF는 안정적이고 과적합에 강한 보수형 모형, LightGBM은 고정밀·고효율의 진보형 모형으로 구분되며, 본 연구에서도 이러한 일반적 경향이 뚜렷하게 확인되었다.

이에 비해 OLS는 R² = 0.9567, RMSE = 282.5, MAE = 210.3으로 비선형 패턴을 충분히 설명하지 못하였으며, ElasticNet 역시 R² = 0.8512로 설명력이 낮고 RMSE와 MAE가 각각 448.7, 339.2로 오차가 상대적으로 크게 나타났다. 특히 두 선형모형은 고온 구간에서 실제 연적산온도 값을 지속적으로 과소추정하는 경향을 보였다(Fig. 3 A-B). 한편 SVR (R² = 0.3738, RMSE = 1552.9, MAE = 1208.6)은 비선형 커널을 사용하였음에도 불구하고, 데이터 규모와 분산이 큰 기후자료의 특성상 학습 불안정성이 높아 예측값이 전반적으로 압축되어 분포하는 경향을 보였다(Fig. 3 C).

연적산온도 예측모형 활용

최적 예측모형으로 선정된 LightGBM을 이용하여 대한민국 전역의 연적산온도를 격자 단위로 예측하여, 기준온도·공간해상도·기후변화 시나리오 등 입력조건의 차이에 따른 예측모형의 적용 가능성을 평가하였다

동일한 기후자료(MKPRISM v2.1, 2000-2019, 해상도 30s)를 사용하여 기준온도를 각각 -5, 0, 15 °C로 변화시킨 결과, 기준온도가 높을수록 연적산온도가 전반적으로 낮게 나타났으며, 기준온도에 따른 공간적 대비의 차이도 확인되었다(Fig. 4). 기준온도 -5 °C 기준에서는 전국 평균 6,189, 최소 4,461, 최대 8,101 °C·day로 분석되어 범위(최대-최소)는 약 3,640 °C·day였다. 0 °C 기준에서는 평균 4,533, 최소 3,062, 최대6,262, 범위 3,200 °C·day로 15 °C 기준에서는 평균 1,038, 최소 378, 최대 1,654, 범위 1,276 °C·day로 나타났다. 기준온도 상승에 따라 평균 대비 범위의 상대비율은 -5 °C 기준 58.8 %에서 0 °C 기준 70.6 %, 15 °C 기준 122.9 %로 증가하였다. 즉, 기준온도가 높아질수록 연적산온도의 지역 간 차이는 더 커져 상대적 공간 변동성이 증가하는 경향을 보였다. 이는 고온 기준에서 특정 지역(저위도·해안)의 연적산온도 우세가 강화되고, 고위도·고도 지역은 생육한계 이하의 일수가 증가함에 따라 공간적 불균형이 심화된 결과로 해석된다. 결과적으로 공간적 대비가 강화되고, 기준온도에 따라 공간 패턴이 다르게 나타나는 양상을 보였다.

이러한 결과는 기준온도 설정에 따른 연적산온도 예측의 공간적 차이를 반영하며, 생물 종 특이적 적산온도를 활용하지 않으면 공간적인 예측 왜곡이 발생할 수 있음을 의미한다. 이는 다양한 기준온도를 반영하여 예측할 수 있는 본 연구의 LightGBM 기반 연적산온도 예측모형의 필요성을 보여준다.

Fig. 4

Spatial prediction of annual growing degree days using the LightGBM model under different base temperature thresholds (−5 °C, 0 °C, and 15 °C)

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-f4.png

Fig. 5는 기후자료의 해상도와 기후모형 차이에 따른 모형 적용성을 검증한 결과이다. 기상청의 MKPRISM v2.1 (2000-2019, 해상도 30s), WorldClim 2.1 (1970-2000, 해상도 10min)을 입력자료로 활용하여 기준온도 12°C 로 연적산온도를 예측하였다. MKPRISM v2.1 결과의 전국 평균 연적산온도는 1,954 °C·day였으며, WorldClim 2.1 결과는 평균 1,665.3 ° C·day으로 공간적 분포 경향은 대체로 일치하였으나, 수치에서는 차이를 보였다. 이는 연적산온도 예측에서 기후모형과 해상도 선정의 중요성을 시사하며, 본 연구의 LightGBM 연적산온도 예측모형이 다양한 공간해상도 또는 기후모형에도 적용가능함을 보여준다.

Fig. 5

Applicability of the LightGBM-based prediction model for annual growing degree days across different gridded climate datasets

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-f5.png

마지막으로, 본 모형에 현재기후(2000-2019, MKPRISM v2.1) 와 미래기후(2046-2055, CMIP6 SSP3-7.0) 자료에 기준온도 6.3°C 로 입력하여 기후변화 시나리오에 따른 연적산온도의 변동평가를 수행하였다(Fig 6). 현재기후의 전국 평균 연적산온도는 3,119 °C·day, 최소 1,921 °C·day, 최대 4,490 °C·day였으며, 미래 SSP3-7.0 2046-2055 시나리오에서는 평균 3,816 °C·day, 최소 1,953 °C·day, 최대 4,747 °C·day로 상승하였으며, 전체 평균이 약 +697 °C·day(약 22%) 증가하였다. 특히 남해안과 제주 지역, 영남 내륙 일부에서의 상승폭이 가장 두드러졌으며, 한반도 전역의 열적 생육자원이 확대되는 양상이 확인되었다. 이는 LightGBM을 활용한 적산온도 예측모형이 기후변화 시나리오 영향평가에 활용가능함을 보여준다.

Fig. 6

Spatial prediction of annual growing degree days using the LightGBM model under historical (20002019) and future (2046-2055, SSP3-7.0) climate conditions

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-f6.png

Canavar et al.(2010)은 튀르키에와 독일의 해바라기 품종으로 시험하여 파종 및 수확을 위해 8.2 °C 기준온도로 2,263.57°C·day가 필요하다고 보고하였다. 본 요구 조건을 활용하여 대한민국의 해바라기 재배적지를 예측하였다. 그 결과 현재는 남부지방과 서울이 재배적지로 예측된 반면 SSP3-7.0 2046-2055에서는 태백산맥과 소백산맥 일부를 제외한 대부분의 지역이 재배적지로 예측되었다(Fig 7).

Fig. 7

Potential cultivation areas of sunflower (Helianthus annuus) in South Korea estimated using the required growing degree days (GDD) under current (2000-2019) and future (SSP3-7.0, 2046-2055) conditions.

http://dam.zipot.com:8080/sites/WTS/images/N0260140406/N0260140406-f7.png

결과적으로 본 연구에서 개발된 적산온도 예측모형은 기후변화에 따른 농업, 잡초, 해충 등의 변동을 예측하는데 사용될 수 있을 것으로 기대된다. 또한 농업기후 모형화, 작물 관리 의사결정 및 기후변화 영향평가의 정밀도 향상에 기여할 수 있음을 보여주며 향후 유사한 접근방법을 통해 다른 국가, 대륙의 기후-생태 응용연구에도 활용될 수 있을 것이다.

결론

본 연구에서는 대한민국 96개 종관기상관측소(ASOS)의 장기 기온자료(1994-2023)를 활용하여 연적산온도를 예측하기 위한 머신러닝 기반 회귀모형을 개발하고 성능을 비교하였다. 다섯 가지 회귀 알고리즘(OLS, ElasticNet, SVR, RF, LightGBM) 중 LightGBM이 가장 높은 예측 정확도와 계산 효율성을 보이며 최적 모형으로 선정되었다. 최적화된 모형을 남한 상세기후자료(MKPRISM v2.1), WorldClim 2.1, 및 미래 기후 시나리오(CMIP6 SSP3-7.0)에 적용한 결과, 기준온도, 기후모형, 해상도에 따른 공간적 변동을 보여줬으며, 기후변화시나리오에 따라서 2046-2055년에는 전국 평균 연적산온도(기준온도 6.3°C)가 약 22% 증가할 것으로 예측되었다. 특히 남해안과 제주 지역에서 증가폭이 가장 크게 나타났다.

제안된 예측 모형 개발 프레임워크는 일 단위 누적 연산 없이도 제한된 기후 입력자료를 이용해 다양한 기준온도 조건에서 연적산온도를 고해상도로 예측할 수 있는 효율적 대안을 제시한다. 본 연구 결과는 LightGBM을 비롯한 머신러닝 기법이 농업기후 모형화, 작물 관리 의사결정, 및 기후변화 영향평가의 정밀도 향상에 기여할 수 있음을 보여주며, 향후 유사한 접근방법을 통해 다른 국가, 대륙의 기후-생태 응용연구에도 활용될 수 있을 것으로 기대된다.

ACKNOWLEDGEMENTS

본 연구는 농촌진흥청의 공동연구사업 (과제번호: RS-2024-00428455)의 지원에 의해 수행되었음.

References

1 Andrews, N., Coop, L., Stoven, H., Noordijk, H. and Heinrich, A. 2021. Vegetable degree-day models: An introduction for farmers and gardeners. Oregon State Univ. Ext. Serv. EM 9305.  

2 Bonhomme, R. 2000. Bases and limits to using ‘degree day’ units. Eur. J. Agron. 13: 1-10.  

3 Canavar, Ö., Ellmer, F. and Chmielewski, F.M. 2010. Investigation of yield and yield components of sunflower (Helianthus annuus L.) cultivars in the ecological conditions of Berlin (Germany). Helia 33(53): 117-130.  

4 Breiman, L. 2001. Random forests. Mach. Learn. 45(1): 5-32.  

5 CF Conventions. 2023. CF metadata conventions v1.11.  

6 Daly, C., Halbleib, M., Smith, J.I., Gibson, W.P., Doggett, M.K., Taylor, G.H., Curtis, J. and Pasteris, P.P. 2008. Physiographically sensitive mapping of temperature and precipitation across the conterminous United States. Int. J. Climatol. 28: 2031-2064.  

7 Du, X., Fan, G., He, Y. and Zhang, F. 2020. Modeling the potential distribution and voltinism of Spodoptera frugiperda using degree-day accumulation under climate change. Pest Manag. Sci. 76: 2291-2301.  

8 Eyring, V., Bony, S., Meehl, G.A., et al. 2016. Overview of the Coupled Model Intercomparison Project Phase 6 (CMIP6). Geosci. Model Dev. 9: 1937-1958.  

9 Fick, S.E. and Hijmans, R.J. 2017. WorldClim 2: New 1-km spatial resolution climate surfaces for global land areas. Int. J. Climatol. 37: 4302-4315.  

10 Forcella, F., Benech Arnold, R.L., Sánchez, R. and Ghersa, C.M. 2000. Modeling seedling emergence. Field Crops Res. 67(2): 123-139.  

11 Gardarin, A., Dürr, C. and Colbach, N. 2010. Modeling the germination of 25 weed species: Relationships with seed traits. Weed Res. 50: 69-78.  

12 Giorgi, F. and Gutowski, W.J. 2015. Regional dynamical downscaling and the CORDEX initiative. Annu. Rev. Environ. Resour. 40: 467-490.  

13 Jeon, H.Y., Kim, D.S., Yiem, M.S. and Lee, J.H. 1996. Temperature-dependent development and forecasting model for hatching of overwintering eggs of Pseudococcus comstocki (Kuwana). Kor. J. Appl. Entomol. 35(2): 119-125.  

14 IMS Health (Intercontinental Medical Statistics Health Incorporated). 2023. Pollenlibrary-Common Sheep Sorrel (Rumex acetosella). https://pollenlibrary.com/Specie/Rumex+acetosella (Accessed Jan. 28. 2023).  

15 Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., et al. 2017. LightGBM: A highly efficient gradient boosting decision tree. Adv. Neural Inf. Process. Syst. 30.  

16 Kim, M., Jung, G., Kim, S., Lee, J., Jeon, W., et al. 2017. Effects of effective accumulated temperature (GDD) by sowing dates on the growth and yield of maize. Korean J. Crop Sci. 62(3): 214-223.  

17 Kim, S., Uhm, K., Jin, D. and Park, H. 2019. Comparison of the occurrence timing of rice pests using effective accumulated temperature in northern agricultural regions. Kor. J. Appl. Entomol. 58(3): 239249.  

18 KMA Climate Information Portal. 2024. Korea Meteorological Administration Climate Information Portal. Available at: https://www.climate.go.kr.  

19 Koo, B., Lee, C., Lee, C., Kim, J. and Park, M. 2001. Effects of accumulated temperature on growth and yield of barley during the growing season. Kor. J. Crop Sci. 46(6): 468-472.  

20 Lee, C., Koo, B. and Yoon, E. 2000. Changes in days required, accumulated temperature, and yield characteristics by sowing dates in spring barley cultivation. Kor. J. Crop Sci. 45(6): 366-369.  

21 McMaster, G.S. and Wilhelm, W.W. 1997. Growing degree-days: One equation, two interpretations. Agric. For. Meteorol. 87: 291-300.  

22 National Geographic Information Institute (NGII). 2023. Digital Elevation Model (DEM), 90 m resolution. Available at: https://map.ngii.go.kr.  

23 Shim, K., Lee, J., Koo, B., Shin, M. and Yoon, S. 2019. Determining optimal sowing dates for waxy corn in central-northern regions using growing degree days. Kor. J. Crop Sci. 64(3): 269-277.  

24 Smola, A.J. and Schölkopf, B. 2004. A tutorial on support vector regression. Stat. Comput. 14(3): 199-222.  

25 Steinmaus, S.J., Prather, T.S. and Holt, J.S. 2000. Estimation of base temperatures for nine weed species. J. Exp. Bot. 51(343): 275-286.  

26 UC IPM (Univ. of California Agriculture and Natural Resources). 2023. Degree-day models and online calculators. Available at: https://ipm.ucanr.edu/weather/degree-days/.  

27 USA-NPN (USA National Phenology Network). 2023. Accumulated Growing Degree Days (AGDD) gridded dataset. Available at: https://www.usanpn.org/data/aggd.  

28 Winkler, A.J., Cook, J.A., Kliewer, W.M. and Lider, L.A. 1974. General Viticulture. Univ. of California Press, Berkeley, CA. USA.  

29 Zou, H. and Hastie, T. 2005. Regularization and variable selection via the elastic net. J. R. Stat. Soc. B 67(2): 301-320.