会社の成長を測定するための統計の応用
エグゼクティブサマリー
トップラインの成長指標を取得したら、分析を実際に開始できます。
  • 収益やユーザーの成長など、企業のトップラインの数値に関係する内部および外部の多くの要因があります。
  • 重要なのは、マーケティングやPRなどの意図されたアクションの効果を分離して、それらが将来の使用にどれほど効果的であったかを理解できるようにすることです。
  • 金融市場で一般的に適用されるツールは、従来のビジネス慣行に簡単に適用できます。
測定する成長の側面を把握してから、ベンチマークを作成します。
  • ビジネスの成長戦略には、分解して測定できる3つの変数があります。それは、トップラインのユーザーの成長、維持、エンゲージメントです。
  • 単純な回帰モデルは、最も一般的には通常最小二乗法を使用して、ビジネスが経験したベンチマークの「通常の」成長を確認できます。これにより、成長パフォーマンスへの影響について、さまざまな内的および外的な力をテストできます。
  • 採用された各成長戦略を個別のイベントとして扱わないでください。一連のイベントは、各時点でパフォーマンスが異なる場合がありますが、全体的な影響が組み合わさって重要な結果を生み出す可能性があります。
分析プロセスの構築を開始する:赤いニシンを取り除き、機械学習による継続的な改善に目を向けます。
  • 重要であるが1回限りのイベント(Cスイートの辞任など)が発生した場合は、インジケーター変数を使用して、データポイントを交絡した無関係のイベントとしてマークします。これらのイベント自体も、それらの孤立した効果について時間をかけてテストすることができます。
  • 同時に発生する特定のイベントの非線形性を考慮に入れてください。正負の効果は、単独の場合と同じではない場合があります。これは、企業がネガティブなニュースの大洪水を一度にリリースすることで「入浴」できる公共市場で見られ、悪いニュースの事実からの最初の「修正された」ヒットにつながり、その後の影響はわずかです。
  • また、成長指標のプロセスの構築を開始します。時間の経過とともにより多くのデータを収集すると、洞察の精度が向上します。
  • プロセスへのデータフィードの自動化を検討し、組織の他の領域からデータを収集します(たとえば、ソフトウェア更新の効果をテストするためにGitHubにリンクします)。時間の経過とともに、反復的な機械学習の原則を成長測定に適用すると、会社がその進捗状況を理解する上での価値が高まるだけです。

前回の記事のフォローアップとして、ビジネスの成長の原動力を特定する方法の一部として、今度はうさぎの穴をさらに掘り下げて、成長イニシアチブの影響を測定する方法を調べたいと思います。製品の更新、PR、マーケティングキャンペーンなどのアクションが顧客の成長、維持率、エンゲージメントに与える影響を評価するためのツールをいくつか提供します。これは、統計家としての私の以前の仕事からの反省を表しており、企業が取引された証券の反応を介して内部および外部のイベントの評価への影響を評価するのに役立ちます。

ヘッジファンドやウォールストリートの世界でより一般的な統計的影響ツールは、現在適用されている方法よりも、成長を管理するためのテクノロジー企業にとってはるかに役立つ可能性があると思います。ユーザーまたはクライアントの行動に関するさまざまな高周波情報を利用できるようにするテクノロジーにより、熟練した統計アナリストまたはデータアナリストが商業チーム内の真の資産となる可能性があります。

成長の影響を測定する方法はたくさんあります

評価への統計的影響を測定する例として、上場企業が新製品を発表し、それが評価にどの程度影響したかを知りたいと仮定します。実際の影響を見積もるには、以下を考慮する必要があります。

  1. セキュリティと市場との相関関係に照らして、その日の市場自体のパフォーマンス。
  2. 同時にリリースされた他の会社関連情報の影響。
  3. 新しい情報がない場合でも、証券価格とユーザーの行動が一般的な変動から日常的に変動するという単純な事実。
  4. 価格上昇の統計的に有意な傾向という観点から見た、長期的な影響。

民間企業の場合、株価活動の結果として機能する短期および長期のアクティブユーザーまたはクライアントの変化について同じ分析を行うことができます。これは、エンゲージメントの保持と深さの指標にも当てはまります。

この丸みを帯びた分析形式を確立することで、企業は、実際にはランダムな変動にすぎない市場やユーザーの反応に惑わされるのではなく、はるかに強力な情報信号に基づいて限られたリソースを振り向けることができます。信号をノイズから分離する統計モデルを設定する最初の作業は、企業の成長努力にもたらす洞察を介して多大な利益をもたらす可能性があります。これは、新しいデータを受信したときに簡単に(そして多くの場合は自動的に)更新および改良できる反復プロセスでもあります。

テストするターゲット指標の選択

企業による測定作業は、次の成長の側面の少なくとも1つを対象にする必要があります。

  1. トップラインの成長 、時間の経過に伴う総売上高またはアクティブユーザー/クライアントの変化として定義されます。
  2. 保持 ユーザーとクライアントの数。特定のユーザーまたはクライアントの平均存続期間として定義されます。
  3. エンゲージメントの深さ ユーザーとクライアントの数。実行されるコアアクションの頻度またはプラットフォームを介したトランザクションの量として定義されます。

3つの次元はすべて定量化可能であり、会社はその値をこれらの3つの点によって形成される三角形の面積として概念化できます。 1つが崩壊すると、他の2つの潜在的な価値は厳しく制限されます。 「あなたを愛する少数のユーザーはあなたを愛する多くのユーザーよりも優れている」という多くの創設者や投資家に確かに同意しますが、これが強力なエンゲージメントと維持に加えてトップラインの成長の重要性と矛盾するとは思わない。軌道はレベルよりもはるかに重要であり、真に熱心なユーザーの少数のグループから始めて、そもそも長期的な成長のための初期条件を設定するのが最善です。

次に、会社の主要なタスクは、これら3つの主要なメトリックの1つ以上に対するアクションの真の効果を測定できる分析フレームワークを確立することです。会社は、モデルごとに異なるモデルをテストするか、連立方程式などのツールを使用してモデルをより直接的にリンクすることができます。私の経験では、マーケティングとPRの取り組みは、会社が投資の見返りを受け取っているかどうかについての厳密な分析の欠如に特に苦しむ傾向があります。合計視聴回数、クリック数、シェアなどの特定の指標はほとんどの場合記録されますが、これらはすべて目的を達成するための手段であり、顧客のコンバージョンとエンゲージメントへの影響に関する次の質問が真剣に分析されることはめったにありません。

ベンチマークの選択と1回限りのイベントの例

まず、1回限りのイベントの簡略化されたバージョンから始めます。会社が0日目に新製品のアップデートをリリースするか、大きなPRストーリーを公開し、それが成長への影響という点で正しい方向への動きを表しているかどうかを知りたいとします。会社が同様の取り組みを継続する必要があるという実際のシグナルを受信したかどうかを判断するには、問題のイベントがない場合に、どれだけ増加したか、どれだけ増加したかを知る必要があります。

ベンチマークの成長は、外部変数と内部変数に基づいて企業の成長、維持、またはエンゲージメントを予測する回帰モデルを介して推定できます。場合によっては、製品の更新の影響を受けるユーザーを分離する機能により、コントロールグループを使用した直接A/Bテストが可能になります。ただし、これは、現在および潜在的なすべてのユーザーにある程度均一に影響を与える大規模な製品、PR、およびビジネスの取り組みには当てはまりません。このようなテストに利用できる優れたリソースはいくつかありますが、多くの初期段階の企業はそれらを高価だと感じる可能性があります。

このモデルで考慮できる変数は次のとおりです。

セクターの傾向
  • 総売上高の観点から、関連するセクターの成長。
ターゲット顧客の傾向
  • セクターのトレンドとは異なり、ターゲット顧客がすでにセクターと取引を行っているかどうかに関係なく、ターゲット顧客自身の成長に重点を置いています。
S&P500と追加のセクター関連サブインデックス
  • クライアントが金融会社である場合、または資本市場の直接的または心理的影響の影響を受ける可能性がある場合。
金利や為替レートなどのマクロ変数
  • ビジネスモデルによっては、金利と為替レートが製品の競争力に影響を与える可能性があります。
紹介率などの内部要因
  • 企業の成長は、外部要因と内部要因の組み合わせです。現在のユーザーからの紹介率(重要な勢いの影響となる可能性があります)、ユーザー満足度の評価、ソーシャルメディアアクティビティなど、それ自体で追跡することが重要な内部指標はすべて役立つ場合があります。
季節性/周期性
  • インジケーター変数は、条件が満たされた場合は1に等しく(たとえば、月がホリデーシーズンに該当する場合)、それ以外の場合は0になり、に関連する可能性のある任意の月/曜日の影響を制御するために使用できます。ユーザーアクティビティ。

すべての変数は、パーセンテージではなく対数を使用して、絶対レベルではなく変化率として指定する必要があります。

各変数の時間枠も同様に慎重に検討する必要があります。一部の変数は主導的です(たとえば、株式市場は期待に大きく基づいています)が、ユーザー満足度評価などの他の変数は過去の経験に基づいていますが、確かに期待される成長に関連する可能性があります。

回帰自体については、通常最小二乗(OLS)から始めて、特定の理由で他の関数形式にのみ進むことをお勧めします。 OLSは用途が広く、同様に、他のより複雑な形式よりも結果をより直接的に解釈できます。 OLSのコンテキストでの変更には、非線形変数、交互作用変数(たとえば、現在の顧客満足度やソーシャルメディアアクティビティ)の対数回帰、およびより大きな値で不均衡な影響があると思われる二乗変数が含まれます。成長は指数関数的であることが期待されるため、対数回帰は確かに強力な適合を証明する可能性があります。

アクションの影響の期間については、ユーザーのアクションまたは購入の頻度を考慮して、影響を探す適切な間隔を決定するのに役立ててください。 1日より長い時間枠を使用する場合、週ごとのアクティブユーザーは、その週の日ごとのアクティブユーザーの合計ではないことに注意してください。私がその週に毎日あなたの製品を積極的に使用している場合、私は毎日の分析のために毎日数えられます。その後、週次分析に変更した場合、私は1回だけ表示する必要があるため、個々の日数を合計すると過大評価されます。

次に、このモデルを使用すると、これらの説明変数のパフォーマンスに基づいて、特定の瞬間または継続的な期間の予想される成長/保持/エンゲージメントを見積もることができます。この予想される成長とイベント後に観察される実際の成長との違いは、影響を示す可能性のある異常な部分です。この異常な成長を予想される成長の標準偏差で割ると、異常なコンポーネントが偶然に発生する可能性がどの程度あるかがわかります。通常、1.96の結果(予測値から約2標準偏差離れている)は、偶然に発生しなかったと見なすためのカットオフとして使用されます。

コホートのコンテキストでは、保持とエンゲージメントは、連続するコホート間での変化(つまり、各コホートに対して固定された値を保持する)の観点から、または全体の保持とエンゲージメントの経時変化の観点から考えることができます。コホート。

一連のイベントによる累積的な成長への影響

成長戦略は、多くの場合、1回限りの取り組みではなく、一連のイベントを展開することを目的としています。これは、複数の取り組みを行うことによるより直接的な影響と、顧客にパターン自体を示すことによる根本的な影響の両方を目的としています。したがって、影響分析では累積的な影響も調べることができます。個々に重要でない一連のイベントは、重大な累積的影響をもたらす可能性があり、逆に、一連の重要なイベントは、重要でないことにつながる可能性があります。

最初の状況は、「ゆっくりと着実にレースに勝つ」と考えることができます。あなたの売り上げが、関連するセクターよりも1週間あたり数パーセントの速さで増加するとします。特定の企業の成長は偶然にベンチマークとわずかに異なるため、短期的にはこれは何の意味もありません。ただし、わずかなパフォーマンスの低下が十分長く続く場合は、最終的には、会社の成長率が市場の成長率を本当に上回っていると自信を持って述べることができます。

2番目の状況は、本質的にあらゆる種類の逆転です。人々が情報を真に処理する前に開発に反応することができるますます頻繁な手段、および短期間の群れの精神は、より直接的なノイズを通して反応の真の大きさと持続時間を確実に考慮するという課題をもたらします。特定の状況下では、ユーザーと市場は短期的には体系的に過剰反応する傾向がありますが(新しいテクノロジー、通貨市場、そして多くの場合、企業にとって深刻な脅威とはならない悪いニュース)、後で自分自身を修正します。

2つの状況は次のように説明できます。信頼区間は、観測値の95%が含まれると予想できる範囲を示します。これは通常、統計的に有意であると見なすためのしきい値として使用されます。

重大な逆転がないことは、持続的な影響の証拠と見なすことができます。証拠の欠如は欠如の証拠ではないという経験的懐疑論の通常の規則に反して実行されるため、この論理には注意する必要がありますが、それは私たちができる最善のことです。

個々の期間にわたるパーセント/対数の変化を比較するときは注意してください。 99%の減少とそれに続く99%の増加は、わずかな累積変化に正確に相殺されるわけではありません。最終的には累積的な変化を考慮してください。

限られた期間(ホリデーシーズンなど)内の特定のPRキャンペーンなどの一連のイベントの累積的な影響を測定している場合は、その期間に含まれるすべての暦日または週の成長を追跡することをお勧めします。 、それぞれが特定のアクションを実行したかどうか。ヒットの間にわずかな遅延がある場合でも、1-2-3パンチが特定の期間内にノックアウトをもたらすことを基本的に望んでいます。

問題のイベントがさらに離れていても、累積的な影響を評価したい場合は、それらを1つの連続した一連の日数にまとめてから、同じ分析を実行することを検討してください。これでは、基本的に「1日目は1月5日、2日目は3月15日、3日目は4月10日…」と言って、実際に完全に連続した日付であるかのように、ベンチマークによって予測された変化に対する累積変化をテストします。有意性の検定は、累積期間を形成する日数/週数の平方根に標準偏差を上げることを除いて、単一のイベントの場合と同じ式になります。

会社の成長を測定する際の汚染された情報への対処

世界が私たちのアイデアをテストするための完璧な実験室条件の礼儀を私たちに与えることはめったにないので、コアモデルが確立されたら、私たちの行動と同時に期待される成長率に影響を与える他の情報を制御する必要があります測定を求めています。

PRイベントや製品のアップデートと同時に、残念ながらトップエグゼクティブがマスコミからのファンファーレの中で競合他社に向けて出発することを決定し、一部のユーザーがこれを相対的なメリットのシグナルと見なす可能性があると懸念しているとしましょう。 2つの製品。残念ながら、非常に迅速な解決策の1つは、インジケーター変数を使用して、データポイントを交絡した無関係のイベントとしてマークすることです。

ただし、「交絡」イベントの以前のインスタンスに関するデータを取得できる場合は、特定のイベントが同様の状況でどの程度の影響を与える傾向があるかを予測できる横断的分析を実行でき、削除できます。最終結果から予想される影響。上記の例では、他社の著名なチームメンバーの離職を取り巻くユーザーアクティビティに関するデータにより、その特定の要因の影響を推定して分離し、希望したPRイベントまたは製品の更新の影響を分離することができます。評価します。

多くの企業はまた、季節や休日などの特定の重要な瞬間に基づいて季節性に直面する可能性があります。これを制御するために、問題の時期にインジケーター変数を割り当てます。

特定の影響の非直線性

成長努力のための分析と戦略の結果を検討するとき、人々が前向きな進展に反応するためにどのように文書化されているかについての特定の非線形効果を覚えておく価値があります。

アップ感度とダウン感度は大きく異なる場合があります。データと時間が許せば、両方があなたに関連している場合は、ポジティブイベントとネガティブイベントの両方の予想される効果を推定することを検討してください。残念ながら、多くの場合、ユーザーの行動から金融市場に至るまでの下向きの動きは、上向きの動きよりもはるかに急激で深刻なものになる可能性があります。

複数のアクションを一度に実行することによる複合効果は、それらを順番に実行することの効果と等しくない場合があります。これは、進行中のパターンの事実自体がプラスまたはマイナスの効果をもたらす可能性があるためです。会社が毎月製品の更新をリリースするパターンは、ユーザーに自信を植え付けることができますが、レイオフや評価減などの否定的なイベントを複数回発表すると、会社が自分自身を完全に理解していないという心配を引き起こし、非常に不釣り合いな影響を与える可能性があります状況。上場企業は、悪いニュース自体の事実から最初の「修正された」ヒットが発生する傾向があり、その後の影響はわずかであるため、多くの場合、「入浴」してすべての悪いニュースを一度にリリースします。たとえば、「魚雷効果」は、悪いニュースの単なる存在が値下げの意味のある部分を説明できるという経験的現象を説明しています。したがって、負のドロップは、ニュースまたは開発の実際のコンテンツからの限界効果の減少に道を譲る初期の固定効果に分解することができます。 PRキャンペーンは、1つの単一のメガイベントよりもシーケンスとしてうまく機能します。これは、目標が時間の経過とともに会社を位置付けることであるためです。

もちろん、分散は過去にのみ測定できますが、特定のイベントによって、根本的な真の分散と、異常な成長が偶然に発生した確率が変わる可能性があります。新しい差異自体は問題のイベントの結果であるため、それに伴うより大きな差異に基づいてイベントの重要性を却下するという循環論法を回避するために、以前の差異を使用する必要があります。ただし、いつものように、議論があり、それぞれの状況は異なる場合があります。

前に述べたように、人間の心理学と非常に現実的な市場構造の両方のために、成長または成長の鈍化は両方ともしばらくの間同様の効果を生む可能性があります。運動量効果を測定するために利用できるさまざまな高度な自己相関テストがありますが、ラグバージョン自体の成長系列を回帰するより「手動」のアプローチの方が透明性が高く、実験が容易であることがわかります。

ビジネスにおける機械学習への取り組みに関する結論

このようなテストを可能にするモデルが開発された後は、ユーザーの行動や売上などを追跡するための会社のプラットフォームをコードに直接リンクして、新しいデータを受信したときに係数を継続的に更新できない理由はありません。私の個人的な好みは、データセットのサイズとより最近の情報のより高い値とのバランスを取り、季節性の場合には当然1年中のすべての時間を含むという点で、可能な場合は常に1年間の推定期間を設けることでした。

事業や製品の性質に構造的な変化がないと仮定すると、推定期間を1年を超えて延長しない理由はありませんが、急成長している若い企業は急速に進化する傾向があります。ソフトウェア主導の企業は、GitHubに直接リンクして、ソフトウェアの更新が影響について自動的にテストされるプロセスを作成できます。この直接リンクを作成し、機能を自動的に進化させることで、会社に機械学習を導入するための第一歩を踏み出しました。

情報が世界で最も価値のある商品であることがよく指摘されますが、データが情報ではないということはあまり言及されていません。それどころか、企業は、競合する物語を伝えているように見える可能性のある非常に多くのデータに圧倒されており、その多くは、ランダム性に基づく単なる偽のパターンである可能性があります。統計は、最高の状態で、主要な変数と関係に迅速に焦点を合わせ、実際のテストのためにそれらを展開するという削減のプロセスです。この形式の分析の精神は、何よりも、意思決定の基礎となる前にデータが実際の情報であることを証明することにより、意思決定プロセスに健全な懐疑論を吹き込むことです。


コーポレートファイナンス
  1. 会計
  2. 事業戦略
  3. 仕事
  4. 顧客関係管理
  5. ファイナンス
  6. 在庫管理
  7. 個人融資
  8. 投資
  9. コーポレートファイナンス
  10. バジェット
  11. 貯蓄
  12. 保険
  13. 借金
  14. 引退