Oui, il est très probable à mon avis qu'il y ait d'autres facteurs que juste la fréquence d'usage de chaque lettre qui influe sur la probabilité de rencontrer une autre lettre. Par exemple, on peut imaginer qu'il est très probable que un nom de famille commençant par A soit suivi d'un prénom commençant par A car ces deux sont très fréquents mais à l'inverse en suivant ce raisonnement on pourrait imaginer qu'il serait hautement improbable qu'un nom de famille commençant par W soit suivi d'un prénom commençant par W car les deux sont très peu fréquent (en France); Mais il peut à mon avis avoir un important facteur ethnique car par exemple pour le W, celui-ci est très peu utilisé chez les francophones mais beaucoup plus utilisé chez les anglophones et par conséquent quelqu'un ayant un nom de famille avec un W a de fortes chances d'être anglophone et donc beaucoup plus de chances d'être suivi d'un W (comme Walter White dans la série Breaking Bad).
La solution la plus pertinente à mon avis pour estimer cette probabilité serait de faire du machine learning à partir d'une base de données de nom et prénom de personnes réelles comme par exemple un annuaire téléphonique. L'algorithme "comprendrait" à force de voir des noms complets, la probabilité de combinaison d'initiales.
La solution la plus pertinente à mon avis pour estimer cette probabilité serait de faire du machine learning à partir d'une base de données de nom et prénom de personnes réelles comme par exemple un annuaire téléphonique. L'algorithme "comprendrait" à force de voir des noms complets, la probabilité de combinaison d'initiales.