Qu'appelle-t-on vraiment diversification?

Bonjour à tous,

En parcourant ce fil hier, je me suis rendu compte, du moins je crois, qu’il y avait quelques confusions sur ce qu’on pouvait désigner sous le terme « diversification ». Je vais tenter ici de définir un peu plus proprement plusieurs notions qui ont été abordées dans cette discussion.

1. Corrélation

La corrélation entre deux actifs mesure une dépendance linéaire moyenne entre leurs rendements :

\rho_{A,B} = \frac{\mathrm{Cov}(R_A,R_B)}{\sigma_A \sigma_B}

Ici, \mathrm{Cov}(R_A,R_B) désigne la covariance entre les rendements de A et de B, c’est-à-dire une mesure de la façon dont ils bougent ensemble, tandis que \sigma_A et \sigma_B désignent leurs volatilités individuelles. Elle renseigne sur le co-mouvement moyen, mais uniquement au premier ordre. C’est une relation linéaire.

2. Corrélation conditionnelle

La corrélation conditionnelle consiste à mesurer cette même corrélation dans un sous-ensemble d’états du monde, par exemple lorsque les actions sont en forte baisse :

\rho_{A,B \mid R_A < c}

avec c un seuil de stress. Le signe | se lit ici « sachant que » ou « conditionnellement à ». Donc ici on donne la corrélation entre A et B sachant que le rendement de A est inférieur au seuil c. C’est donc une mesure de dépendance en régime donné (de crise, d’euphorie, etc.), et non sur l’ensemble de l’échantillon.

3. Convexité

La convexité n’est pas une corrélation. C’est une propriété de courbure du rendement d’un actif à un facteur de risque.

Si l’on écrit :

R_B = f(x)

alors l’actif est convexe par rapport au facteur x[1] si :

f''(x) > 0

sur la zone considérée. La convexité est donc un effet de second ordre, et par nature non linéaire. C’est ce qui fait qu’un actif peut devenir protecteur dans les extrêmes sans que cela soit visible dans une simple corrélation moyenne, et sans que cela implique qu’il ne puisse pas offrir un rendement intéressant en régime normal. La corrélation peut bien sûr fournir une information utile sur le co-mouvement moyen entre deux actifs, mais elle reste une mesure linéaire : à elle seule, elle ne permet donc pas de décrire correctement une relation convexe.

Un petit exemple pour illustrer ces notions

Pour illustrer un peu plus concrètement la différence entre corrélation, corrélation conditionnelle et convexité, on peut regarder les rendements annuels de l’indice SG CTA en fonction de ceux du MSCI World.

Si l’on se contente de calculer la corrélation entre les deux séries, on obtient ici environ -0.416. Pris comme cela, on pourrait être tenté d’en conclure que la relation est simplement négative, et donc qu’en moyenne, SG CTA a plutôt tendance à évoluer en sens inverse des actions, et on risque de conclure à tort qu’en cas de croissance extrême des actions, SG CTA devrait baisser.

Le problème, est que cette lecture impose une seule relation linéaire sur tout l’échantillon. Or, on voit bien qu’il n’y a aucune raison pour que le lien entre les deux actifs soit exactement le même dans les années de baisse actions, dans les années plus neutres, et dans les années de forte hausse. Si l’on veut autoriser une relation un peu plus complexe, on peut écrire un petit modèle quadratique :

r_t^{CTA} = \alpha + \beta\, r_t^{World} + \gamma \left(r_t^{World}\right)^2 + \varepsilon_t

Sur les données annuelles, cela donne :

r^{\mathrm{CTA}}_t = 0.042703 - 0.227160\, r^{\mathrm{World}}_t + 0.966167 \left(r^{\mathrm{World}}_t\right)^2 + \varepsilon_t

Autrement dit, la relation entre SG CTA et le MSCI World n’a pas l’air d’être purement linéaire[2]. Dit plus simplement, si les actions baissent fortement, le modèle suggère que SG CTA a tendance à mieux résister, voire à offrir une forme de protection. Et si les actions montent fortement, SG CTA peut aussi monter. Il faut quand même rester prudent ici : on parle d’un échantillon relativement petit.

On peut retrouver cette même intuition d’une autre manière avec les corrélations conditionnelles. Au lieu d’imposer une seule relation sur tout l’échantillon, on découpe les observations en régimes selon le rendement annuel du MSCI World, puis on regarde comment la relation entre les deux actifs se comporte dans chacun de ces régimes. Ici, \mathcal{R}_j désigne simplement le régime j considéré, par exemple r_t^{World} < 0, ou bien 0 \leq r_t^{World} < 15\%, ou encore r_t^{World} \geq 15\%[3]. En ce sens, la corrélation conditionnelle revient un peu à approcher une relation non linéaire par une succession de relations linéaires locales :

r_t^{CTA} = \alpha_j + \beta_j r_t^{World} + \varepsilon_t, \quad \text{si } r_t^{World} \in \mathcal{R}_j

Sur les données annuelles, on obtient par exemple les résultats suivants :

Rendement du MSCI World Corrélation conditionnelle avec SG CTA
World < 0 -0.855
0 <= World < 15% -0.348
World >= 15% 0.433

Autrement dit, la corrélation moyenne ne raconte pas toute l’histoire. Elle dit bien quelque chose d’utile, bien sûr, mais elle écrase aussi des comportements assez différents selon les régimes. En gros, SG CTA semble surtout défensif quand les actions baissent, alors que dans les fortes années de hausse, la relation avec les actions redevient plus positive. La corrélation globale de -0.416 résume donc assez mal une dépendance qui varie sensiblement selon le régime de marché.

Est-ce que la convexité est nécessaire pour qu’un actif soit intéressant dans un portefeuille ?

Un actif peut être utile dans un portefeuille sans être convexe. Il « suffit » qu’il améliore le couple rendement/risque de l’ensemble. Formellement, si l’on combine deux actifs A et B, on a :

\mu_p = w\mu_A + (1-w)\mu_B
\sigma_p = \sqrt{w^2\sigma_A^2 + (1-w)^2\sigma_B^2 + 2w(1-w)\rho\sigma_A\sigma_B}

Le rendement espéré du portefeuille, \mu_p, est linéaire en w, alors que la volatilité agrégée \sigma_p, ne l’est pas : elle est la racine carrée d’une forme quadratique. C’est cette géométrie qui crée le bénéfice de diversification dès que \rho < 1, même si la corrélation reste positive[4].

Illustrons cela sur un petit exemple simple :

  • Actif A : rendement espéré 8\,\%, volatilité 20\,\%

  • Actif B : rendement espéré 5\,\%, volatilité 10\,\%

  • Corrélation \rho = 0,30

Pris séparément :

  • A a un ratio rendement/risque de 0,08 / 0,20 = 0,40

  • B a un ratio rendement/risque de 0,05 / 0,10 = 0,50

En portefeuille 50/50 :

\mu_p = 0,5 \times 8\% + 0,5 \times 5\% = 6,5\%
\sigma_p = \sqrt{0,5^2 \times 20^2 + 0,5^2 \times 10^2 + 2 \times 0,5 \times 0,5 \times 0,3 \times 20 \times 10}
\sigma_p = \sqrt{100 + 25 + 30} = \sqrt{155} \approx 12,45\%

On obtient donc un ratio rendement/risque d’environ :

6,5\% / 12,45\% \approx 0,52

Autrement dit, le portefeuille a un meilleur ratio rendement/risque que l’actif A ou B seul, alors même que :

  • B n’est pas un hedge convexe à A,

  • la corrélation est positive, et relativement élevée, en tout cas plus que ce qu’on observe, par exemple, entre actions et obligations.

  • B peut très bien baisser en même temps que A.

Ce point me semble important, parce qu’il montre qu’un diversifiant n’a pas besoin de « monter dans les krachs » pour être utile. Il peut simplement améliorer l’efficience du portefeuille. C’est d’ailleurs le principe même de la diversification, y compris au sein d’un portefeuille actions très large : le rendement s’agrège linéairement, alors que le risque ne s’agrège pas linéairement dès lors que les corrélations sont imparfaites. Ainsi, détenir à la fois l’action Evil Corp A et l’action Evil Corp B n’a rien d’absurde, même si les deux titres sont très corrélés. En poussant ce raisonnement à l’ensemble des entreprises mondiales, on retrouve l’une des explications fondamentales du fait que les ETF sur indices larges ont historiquement offert un si bon couple rendement/risque.

TLDR :

En pratique, je pense qu’on peut définir les choses suivantes :

  • la corrélation mesure un co-mouvement linéaire moyen,

  • la corrélation conditionnelle regarde ce co-mouvement dans un régime donné, par exemple la queue gauche, droite, au milieu, devant, derrière, comme vous voulez !

  • la convexité mesure la courbure de la réponse de l’actif au facteur de risque,

Donc un actif peut être :

  • faiblement corrélé sans être convexe,

  • convexe tout en gardant une corrélation moyenne positive,

  • structurellement décorrelé sans offrir de protection particulière dans un stress actions.

Pour en revenir à la dernière question du fil mentionné au début : apliqué aux cat bonds, cela veut dire à mon sens qu’ils peuvent être de vrais diversifiants sans être pour autant de bons hedges convexes. Leur intérêt ne tient pas au fait qu’ils monteraient en cas de crise actions, mais au fait qu’ils peuvent améliorer le portefeuille via une source de risque différente et une corrélation imparfaite. Ce n’est pas la même promesse, mais ce n’est pas non plus négligeable.

Autrement dit, reprocher à un actif de ne pas être convexe ne suffit pas à l’éliminer. La vraie question est plutôt : une fois pris en compte son rendement espéré, sa volatilité, sa corrélation au portefeuille risqué, améliore-t-il ou non l’efficience de l’ensemble ?


  1. x peut-être le rendement de A, l’inflation, le nombre de Capybara en amazonie, peu importe ↩︎

  2. Je vous vois venir les statisticiens, le coefficient \gamma est significativement différent de 0! ↩︎

  3. Notons ici que l’on pourrait éviter d’utiliser des bornes arbitraires, mais je crois que le message passe mieux comme ceci. Je n’ai vraiment pas l’ambition de construire un modèle intéressant, mais plutôt d’illustrer des notions importantes à mes yeux. ↩︎

  4. d’ailleurs, vous savez quoi ? On a discuté de quelque chose de similaire pendant mon premier entretien avec Vincent, et j’ai raconté absolument n’importe quoi ! ↩︎

19 « J'aime »

Merci beaucoup Guillaume pour ton excellent travail.

Quelques questions pratiques en tant que simple particulier :

  • Je comprends que la décorrélation suffit en régime normal. Mais si un cygne noir surgit, les corrélations ont tendance à converger vers 1. Est-ce qu’il ne faut tout de même pas idéalement une convexité (ou corrélation conditionnelle “World < 0”) importante pour espérer sauver son portefeuille à levier dans ce cas de figure ?

  • Si j’ai bien compris, un fond comme DBMFE d’Andrew Beer qui suit l’indice Société Générale CTA, pourrait très bien protéger en cas de krach sur le marché actions (car corrélation conditionnelle avec “World < 0” très proche de -1). Cependant, un diversifiant convexe n’est utile que si son coût d’entretien en temps normal ne gomme pas tout le bénéfice du parachute. La corrélation baissant le risque, mais les frais pouvant détruire le rendement. Pour DBMFE, avec un TER de 0.80% par an, auquel s’ajoutent les coûts “invisibles” directement déduits de la performance du fonds (coût du levier, frais de swap, roll yield). Certains fonds ont 2 % ou plus de coût par an, sans compter les frais « invisibles », je cherche donc à savoir si ça peut avoir un impact sur tes conclusions. A partir de quel niveau de coûts globaux cette protection reste acceptable pour ne pas détruire l’efficience à long terme du portefeuille ?

  • La plupart des investisseurs avec NTSG semble partir sur 2/3 NTSG, et 1/3 actifs diversifiants. Sauf que pour ces 1/3, il est facile de tomber dans une sorte d’arche de Noé de diversifiants, ou de la diworsification (en excluant le round robin de diversifiants qui font la même chose, pour mitiger le risque de gérant ou d’algorithme). A partir de quel pourcentage d’allocation au sein du portefeuille un actif diversifiant (ou groupe de diversifiants similaires) conserve t’il un réel impact sur l’efficience globale ? La règle empirique des 5% à 10% minimum par ligne te semble-t-elle mathématiquement justifiée par tes modèles ?

  • En CTO, comment mitiger au mieux la problématique du rebalancement (et donc de la fiscalité). Dans la pratique, si un diversifiant explose à la hausse (exemple : l’or), en vendant + flat tax, ne risque t’on pas de couper sa tendance protectrice ? Comment gérer au mieux cette problématique ?

5 « J'aime »

Merci beaucoup pour ton message :slight_smile:

Mon message initial était volontairement assez circonscrit : je voulais surtout montrer qu’un actif n’a pas besoin d’être convexe pour être un bon diversifiant. Mais tu as raison : si on considère un portefeuille à levier, on s’attaque à d’autres considérations, parce que la question n’est plus seulement « est-ce que cela améliore le ratio de Sharpe ? »[1], mais aussi « est-ce que cela aide le portefeuille à survivre proprement aux crises (et donc éviter les appels de marge) ? ».

Je vais essayer de répondre point par point, je rajoute aussi quelques notes pour que ce soit accessible à des lecteurs un peu moins avancés.

Oui, je te rejoins. En stress aigu, beaucoup d’actifs risqués se mettent à baisser ensemble, et les corrélations ont tendance à augmenter fortement.

Pour un portefeuille sans levier, une simple amélioration du couple rendement/risque peut déjà suffire à rendre un actif intéressant. Pour un portefeuille à levier, en revanche, le sujet devient plus exigeant : ce qui compte, ce n’est pas seulement la volatilité attendue, mais aussi la profondeur du drawdown, sa vitesse, et la capacité à rester investi pendant la crise[2]. De ce point de vue, avoir une poche dont la corrélation conditionnelle devient très négative quand les actions baissent, voire qui présente une certaine convexité, devient effectivement très précieux.

Il faut quand même ajouter une nuance importante sur la nature du levier. Dans un portefeuille contenant des ETF à levier, une partie du risque opérationnel classique du levier disparaît : on n’a pas d’appel de marge au sens habituel du terme, puisqu’il n’y a pas de dette sur le compte à financer ou à rappeler. Cela ne supprime évidemment pas le risque de perte en capital (la volatilité), ni le risque d’un drawdown très violent, mais cela retire quand même un mode de ruine très concret qui existe dans les portefeuilles construits sur marge. Pour un particulier, ce n’est pas un détail.

Je nuancerais aussi l’idée à laquelle on pourrait être tenté d’aboutir, à tort selon moi, à savoir : « en crise les corrélations montent, donc la diversification ne sert plus à rien ». D’abord, même si les corrélations augmentent en stress, cela ne veut pas dire qu’elles deviennent partout égales à 1, ni que tout se met soudain à se comporter exactement de la même façon. On accepte très bien ce raisonnement à l’intérieur même d’un ETF actions large : les actions mondiales sont évidemment très corrélées entre elles, surtout dans les crises, et pourtant personne ne considère qu’il est absurde de détenir tout le marché plutôt qu’une poignée de titres. Pourquoi ? Parce que même entre actifs corrélés, la diversification continue à améliorer le rapport rendement/risque. À mon sens, c’est fondamentalement la même logique ici, simplement transposée du niveau des titres individuels au niveau des classes d’actifs.

En pratique, la hausse des corrélations réduit le bénéfice de diversification, mais ne l’annule pas mécaniquement. Un portefeuille diversifié peut tout à fait continuer à subir un drawdown nettement plus faible qu’un portefeuille non diversifié, même si tout ne se comporte pas parfaitement pendant la crise. C’est d’ailleurs ce que suggère aussi mon test historique, sur lequel je reviens juste après : même si les corrélations ont probablement augmenté pendant les épisodes de stress (surtout entre actions et obligations), le portefeuille avec au moins une poche diversifiante conserve malgré tout un drawdown maximal nettement meilleur que le portefeuille comparable sans cette poche.

Je vais me reposer ici sur des données empiriques « simulées », je n’ai pas la compétence, ni même les informations, pour juger de la qualité de l’implémentation de la stratégie derrière DBMFE. Mais, empiriquement, l’historique me semble plutôt encourageant. L’ajout de managed futures (pas nécessairement que DBMFE d’ailleurs) n’a pas détruit le rendement du portefeuille, mais a au contraire nettement amélioré son profil de risque. Sur l’échantillon testé, un portefeuille incluant ce diversifiant affiche :

  • un CAGR de 8,13 % contre 8,09 % sans DBMFE,

  • une volatilité de 12,87 % contre 16,98 %,

  • un max drawdown de -36,80 % contre -50,05 %,

  • un Sharpe de 0,53 contre 0,43,

  • et une durée maximale de drawdown de 3,54 ans contre 4,70 ans.

Donc, au moins sur cet historique-là, la réponse est plutôt claire : les coûts[3]n’ont pas annulé le bénéfice du diversifiant. Au contraire, la poche a conservé un rendement comparable tout en améliorant sensiblement la tenue du portefeuille en cas de crise.

Je suis d’accord avec ton intuition. En dessous d’un certain poids, une poche diversifiante finit par avoir un effet trop faible pour vraiment déplacer les caractéristiques du portefeuille. En revanche, je ne dirais pas que la règle des 5 % à 10 % minimum par ligne soit une vérité absolue. Je la verrais plutôt comme une heuristique de mise en oeuvre assez raisonnable. En dessous de quelques pourcents, l’effet devient probablement trop faible pour justifier la complexité mentale, les frais, le suivi, et parfois la fiscalité. Par contre, mathématiquement, un diversifiant même avec un poids \epsilon peut améliorer le rapport rendement risque, simplement, l’amélioration risque d’être de l’ordre de 0, mais ce sera une amélioration tout de même !

Aussi, je crois qu’il ne faut pas non plus négliger l’aspect psychologique : même une ligne qui ne représente que quelques pourcents peut avoir une vraie utilité (psychologique) si c’est la seule qui reste verte pendant que tout le reste prend le bouillon.

Je pense que la bonne manière de raisonner, pour éviter de tomber dans la construction de l’arche de Noé, me semble être de raisonner en facteurs de risque distincts[4]. La question, au fond, est simple : est-ce que j’ajoute réellement quelque chose de différent au portefeuille, ou est-ce que je suis simplement en train d’empiler plusieurs produits qui réagissent à peu près pareil ? A mon avis, ces « facteurs de risques » seraient :

  • actions

  • obligations souveraines

  • or

  • matières premières

  • trend-following / CTA

  • cat bonds / risque assurantiel

Vu sous cet angle, deux CTA trend-following appartiennent probablement à la même grande famille, même s’ils portent des noms différents. De la même manière, un ETF obligataire à maturité courte et un ETF obligataire à maturité intermédiaire auront vraisemblablement un comportement assez proche : détenir les deux n’apporte donc pas nécessairement une diversification très importante. À l’inverse, on peut parfaitement avoir 3 ou 4 diversifiants qui ont du sens s’ils correspondent réellement à des facteurs de risque différents.

Donc oui, je pense qu’en pratique, des poches de l’ordre de 5 % à 10 % sont souvent un minimum raisonnable pour qu’un diversifiant « compte » vraiment. Mais je présenterais cela comme une règle pratique, pas vraiment comme une règle mathématique.

Je suis d’accord avec toi : en CTO, la fiscalité complique vraiment le problème. Si une position explose à la hausse, la vendre pour rebalancer peut avoir deux effets désagréables en même temps : déclencher l’impôt, et réduire précisément l’exposition qui sert de hedge. De ce point de vue, un rebalancement trop mécanique peut effectivement être contre-productif.

Mais à l’inverse, ne jamais rebalancer pose aussi problème : à partir d’un certain point, on ne détient plus le portefeuille qu’on croyait détenir. Si l’or ou un CTA devient une énorme fraction de l’allocation, on a cessé d’avoir un portefeuille diversifié pour se retrouver avec une position très concentré.

En pratique, et de ce que j’ai lu jusqu’à aujourd’hui, j’aurais tendance à fonctionner comme ça :

  • d’abord par les nouveaux apports,

  • ensuite avec des bandes de tolérance,

  • et en n’acceptant de vendre en CTO que lorsque l’écart devient vraiment significatif.

On renonce ainsi à une partie du volatility harvesting « pur »[5], mais en CTO l’optimal, n’est probablement pas de coller en permanence aux poids cibles, mais plutôt d’éviter qu’une poche devienne disproportionnée tout en limitant les frottements fiscaux. Cela plaide à la fois pour des bandes de tolérance[6], et pour une certaine inertie dans leur mise en oeuvre.


  1. Le ratio de Sharpe mesure très grossièrement le rendement obtenu par unité de risque prise. Plus il est élevé, meilleur est en principe le couple rendement/risque. C’est une mesure utile, mais elle ne dit pas tout, notamment sur la forme des drawdowns ou sur le risque de se faire sortir d’une position au pire moment. ↩︎

  2. Quand on utilise du levier via un compte sur marge, on investit en partie avec de l’argent emprunté. Si la valeur du portefeuille baisse trop, le courtier peut exiger que l’on remette du cash ou qu’on réduise la position : c’est l’appel de marge. Si on ne peut pas le faire, une partie des positions peut être liquidée de force. C’est pour cela que, avec levier, la question n’est pas seulement « combien ça rapporte en moyenne ? », mais aussi « est-ce que le portefeuille peut encaisser une grosse baisse sans se faire sortir du jeu au pire moment ? » ↩︎

  3. mais il faut être clair, cela reste des coûts simulés, difficile à dire si le futur respectera peu ou prou le passé. Peut-être que ca améliorera plus le portefeuille, peut-être moins, je ne sais pas, mais en première approximation, cela a l’air encourageant. ↩︎

  4. Il faut se demander d’où vient vraiment le risque de chaque poche du portefeuille. Si deux actifs réagissent globalement aux mêmes événements, aux mêmes tensions macro ou aux mêmes mouvements de marché, alors ils portent souvent une part importante du même risque, même s’ils ont des noms ou des enveloppes différentes. À l’inverse, si leurs rendements dépendent de moteurs vraiment différents, la diversification a davantage de chances d’être réelle. ↩︎

  5. L’idée du volatility harvesting, dit très simplement, est la suivante : quand deux poches du portefeuille bougent différemment, le fait de rebalancer de temps en temps oblige mécaniquement à vendre un peu de ce qui a beaucoup monté et à racheter un peu de ce qui a moins monté ou baissé. Si cela se répète dans le temps, on peut améliorer la croissance du portefeuille. C’est intéressant en théorie, mais dans la vraie vie il faut mettre en face les frais, les spreads et, en CTO, la fiscalité. ↩︎

  6. Par exemple, si ton allocation cible est de 10 % d’or, tu peux décider de ne rien faire tant que cette poche reste entre 8 % et 12 % du portefeuille. Tant que l’actif reste dans cette « bande », tu acceptes l’écart et tu évites des arbitrages trop fréquents. Ce n’est que lorsqu’il sort vraiment de cette zone que tu envisages de rebalancer. ↩︎

11 « J'aime »

Un immense merci pour le temps consacré à cette réponse. Ton message est une vraie mine d’or !

C’est rare de lire une analyse qui fait aussi bien le pont entre la rigueur mathématique, la réalité opérationnelle, mais également la psychologie de l’investisseur particulier. Et avec en plus une telle qualité pédagogique.

Vous élevez le niveau sur le sujet des finances personnelles de façon incroyable. Félicitations à toute l’équipe !

2 « J'aime »