Optimal design of artificial neural networks by a multi-objective strategy: groundwater level predictions

Abstract
Currently, environmental modelling is frequently conducted with the aid of artificial neural networks (ANNs) in an effort to achieve greater accuracy in simulation and forecasting beyond that typically obtained when using solely linear models. For the design of an ANN, modellers must contend with two key issues: (a) the selection of model input and (b) the determination of the number of hidden neurons. A novel approach is introduced to address the optimal design of ANNs based on a multi-objective strategy that enables the user to find a set of feasible ANNs, determined as optimal trade-off solutions between model simplicity and accuracy. This is achieved in a multi-objective fashion by simultaneously minimizing three different cost functions: the model input dimension, the hidden neuron number and the generalization error computed on a validation set of data. The multi-objective approach is based on the Pareto dominance criterion and an evolutionary strategy has been employed to solve the combina... Résumé Aujourd'hui, la modélisation environnementale est fréquemment abordée au moyen de réseaux de neurones artificiels (RNA), dans le but d'améliorer la précision des simulations et des prévisions, au delà de celle qui est généralement obtenue avec des modèles purement linéaires. Pour construire un RNA, le modélisateur doit aborder deux aspects clefs: (a) la sélection des données d'entrée et (b) la détermination du nombre de neurones cachés. Une nouvelle approche est introduite afin d'étudier la construction optimale de RNAs grâce à une stratégie multi-objectifs qui permet à l'utilisateur de trouver un ensemble de RNAs possibles, correspondant à des solutions optimales de compromis entre simplicité et précision du modèle. Cela est réalisé dans un cadre multi-objectifs via la minimisation simultanée de trois fonctions de coût différentes: la dimension des entrées du modèle, le nombre de neurones cachés et la généralisation de l'erreur calculée avec un jeu de données de validation. L'approche multi-object...