🌾 RiceYield AI: Predicción de Rendimiento Agrícola Para Pequeños Productores

🏆 Premio al Mejor Póster de Pregrado - 4to Congreso "Vive la Investigación" (UTEM). Proyecto seleccionado entre +99 trabajos de investigación.

📄 Descripción del Proyecto

Este proyecto aborda el desafío de la seguridad alimentaria en la India mediante el desarrollo de modelos de Inteligencia Artificial para predecir el rendimiento de cultivos de arroz (Yield).

A diferencia de los enfoques tradicionales que utilizan datasets estáticos, este proyecto implementó un pipeline de enriquecimiento de datos geoespaciales, integrando variables climáticas históricas y propiedades químicas del suelo en tiempo de ejecución.

El estudio compara el desempeño de Redes Neuronales (Perceptrón Multicapa) frente a algoritmos de Gradient Boosting (LightGBM, XGBoost, CatBoost), demostrando la eficacia de los ensambles de árboles en datos tabulares agrícolas.

🚀 Características Clave (Ingeniería de Datos)

El valor principal de este proyecto reside en la construcción del dataset:

🌐 Integración API NASA POWER: Extracción automática de datos meteorológicos históricos (precipitación, temperatura, radiación) alineados con las coordenadas (Lat/Lon) y las temporadas de cultivo (Kharif, Rabi, etc.).
asd Integración API WoSIS (ISRIC): Obtención de datos edafológicos granulares. Se parsearon respuestas JSON complejas para extraer:
- Nitrógeno, Fósforo, Potasio (NPK).
- pH y Carbono Orgánico del suelo.
- Humedad (con imputación basada en rangos de literatura científica).
⚡ Sistema de Caché Inteligente: Implementación de almacenamiento local (soil_cache.json, climate_cache.json) para optimizar llamadas a APIs y reducir tiempos de re-entrenamiento.

📊 Resultados y Modelado

Se evaluaron múltiples arquitecturas. A pesar de diseñar un MLP (Multi-Layer Perceptron) robusto, los resultados empíricos favorecieron a los modelos de Boosting, lo cual es consistente con la literatura para datos tabulares de tamaño medio.

Modelo	R² Score	Observaciones
LightGBM	0.552	Mejor balance general y velocidad.
CatBoost	0.548	Muy cercano al mejor desempeño.
Random Forest	0.534	Robusto pero más lento en inferencia.
MLP (Red Neuronal)	0.228	Dificultad para capturar relaciones no lineales complejas con estos datos específicos.

Conclusión Técnica: Las variables de manejo agronómico (uso de fertilizantes y pesticidas) resultaron ser los predictores más fuertes, seguidos por las variables climáticas derivadas de la API.

📂 Estructura del Repositorio

El proyecto sigue una estructura de directorios orientada a la reproducibilidad:

RiceYield-AI-Prediction/
├── data/
│   ├── raw/              # Dataset base (crop_yield.csv) y geográficos
│   ├── processed/        # Datos limpios y enriquecidos listos para ML
│   └── cache/            # Respuestas JSON cacheadas de NASA/WoSIS
├── models/               # Modelos serializados (.pkl) y Scalers
├── docs/                 # Informe Técnico y Póster ganador (PDFs)
└── RICE_YIELD_AI.ipynb   # Notebook principal: ETL, EDA y Entrenamiento

🛠️ Tecnologías Utilizadas

Lenguaje: Python 🐍

Data Processing: Pandas, NumPy.

Machine Learning: Scikit-Learn, LightGBM, XGBoost, CatBoost.

Visualización: Matplotlib, Seaborn.

APIs: requests para consumo de servicios REST geoespaciales.

👥 Autores y Créditos

Este trabajo fue desarrollado como parte del curso de formacion especializada de Inteligencia Artificial en la Universidad Tecnológica Metropolitana (UTEM).

[Patricio Abarca Hernández] - [https://github.com/Begluckt]

[Rodrigo Tapia Ferrada] - [https://github.com/Chucaflu11]

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
data		data
docs		docs
models		models
README.md		README.md
RIceYIeldAI.ipynb		RIceYIeldAI.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🌾 RiceYield AI: Predicción de Rendimiento Agrícola Para Pequeños Productores

📄 Descripción del Proyecto

🚀 Características Clave (Ingeniería de Datos)

📊 Resultados y Modelado

📂 Estructura del Repositorio

🛠️ Tecnologías Utilizadas

👥 Autores y Créditos

About

Uh oh!

Releases

Packages

Languages

Chucaflu11/RiceYield-AI

Folders and files

Latest commit

History

Repository files navigation

🌾 RiceYield AI: Predicción de Rendimiento Agrícola Para Pequeños Productores

📄 Descripción del Proyecto

🚀 Características Clave (Ingeniería de Datos)

📊 Resultados y Modelado

📂 Estructura del Repositorio

🛠️ Tecnologías Utilizadas

👥 Autores y Créditos

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages