爱因斯坦发现故事(3)了解什么是差异见解

学习目标

完成本单元后,您将能够:

  • 导航到故事的“差异什么”见解并探索它们。
  • 理解变量之间的关系。
  • 使用这些见解来帮助最大化客户终身价值(CLV)。

了解什么是差异见解

注意

注意

本单元中的说明假设您已根据“使用故事获取大图片”中的步骤成功创建了爱因斯坦探索故事,这是此Trailhead模块中的第一个单元。

在爱因斯坦发现中,什么是差异洞察力是比较见解,可以帮助您更好地理解解释变量与故事中目标(目标结果变量)之间的关系。这些见解基于对数据集的统计分析,可帮助您确定哪些因素会导致结果变量的最大变化。爱因斯坦发现使用瀑布图来帮助您在“什么是差异”洞察中可视化比较。

通过隔离解释变量,您可以看到并了解它与整体的关系,以及它与另一个解释变量的比较。例如,您可以将制造客户的销售业绩与整体销售业绩进行比较。此外,您还可以比较制造和分销客户之间的销售业绩。最后,您可以添加过滤器以关注较小的数据片段(例如特定的销售区域)。

找到使用CLV的最佳客户

在本单元中,我们使用What Is The Difference的见解来探索您之前创建的故事(请参阅“爱因斯坦发现经典”模块中的“创建故事”)。回想一下,这个故事的目标是最大化客户终身价值(CLV)。CLV是一种度量标准,用于预测公司与客户关系的整个生命周期内的盈利能力。

选择什么是差异洞察类型

在Insight导航栏上,单击右上角的向下箭头,然后单击“区别是什么”

在Insight导航栏上,单击向下箭头,然后单击“差异是什么”。

“数据洞察”导航栏显示此类别但不显示图表。要查看图形,必须先选择一个变量。

将解释变量与全球平均值进行比较

在我们的示例故事中,全局平均值表示数据集中所有数据的CLV。将单个变量的CLV与全局CLV平均值进行比较是有用的。要选择变量,请在“数据洞察”导航栏左侧的“ 关联到(选择变量) ”中选择“ 行业 – 运输”

从Related to(选择变量)中,选择要比较的解释变量。

计算完成后,您会在瀑布图中看到最具统计意义的洞察力。

比较CLV for Industry = Shipping与全球平均值。

CLV出现在图表的顶部,提醒我们将此故事配置为最大化CLV作为结果变量。

注意

注意

如果这里的图像与您在爱因斯坦发现中看到的屏幕略有不同,请不要担心。界面元素通常是相同的,但一些细节 – 包括它们显示的数据 – 可能略有不同。

在图表的顶部,标记为Industry is Shipping(Average)的灰色条显示行业运输时的平均CLV。要查看更多详细信息,请将鼠标悬停在灰色栏上。

将鼠标悬停在灰色栏上,查看行业发货时平均CLV的数字。

当我们的故事将CLV最大化为结果变量时,图表中的红色条表示将CLV从平均值降低的条件。将鼠标悬停在图表中的红色条上。

红色条表示将CLV降低到全球平均值以下的条件。

在此示例中,当Industry is Shipping并且BillingState是Texas时,CLV是-89,或低于平均值89。请注意,左侧相应的洞察描述以灰色突出显示。

当我们的故事将CLV最大化为结果变量时,图表中的绿色条显示了CLV从平均值增加的条件。将鼠标悬停在图表中的绿色条上。

绿色条表示将CLV提高到全球平均值以上的条件。

在此示例中,当Division是标准硬件时,CLV高于平均值190。请注意,左侧相应的洞察描述以灰色突出显示。

将鼠标悬停在图表中的条形图上时,会突出显示相应的洞察说明。
注意

注意

如果我们的故事目标是最小化CLV,那么绿色和红色的颜色将会颠倒过来。

图表底部的蓝色条显示全局平均值(结果),表示数据集中所有数据的平均CLV(20,136)。

蓝色条表示数据集中所有数据的平均CLV。

比较两个变量

接下来,我们添加第二个解释变量并比较两者。在Insights导航栏上,转到右侧的Between(选择变量),然后选择Industry – Technology

选择第二个变量与第一个变量进行比较。

计算完成后,您会看到比较两个行业的瀑布图。

将技术CLV与运输CLV进行比较。

一目了然,这张图表显示,CLV for Industry is Technology (平均值)在很多方面优于Industry is Shipping(平均值)。例如,当账户被评为热门时,科技的终身CLV比运输更好。但在德克萨斯州,海运拥有比科技更好的CLV。

将鼠标悬停在图表顶部的灰色栏上,显示Industry is Shipping(Average)

悬停在图表中的灰色条上的详细信息。

将鼠标悬停在图表底部的蓝色条上,显示行业是技术(平均值)

悬停在图表中的蓝色条形图上的详细信息。

比较实际的CLV数字证实了技术的平均CLV高于Shipping。

添加过滤器

(可选)您可以添加过滤器以进一步将分析重点放在数据的子集上。在“数据洞察”导航栏的最右侧,单击“ 搜索故事洞察”,然后选择“ 类型 – 咨询”

从搜索故事洞察中选择以过滤图表。

计算完成后,您会看到一个瀑布图,比较两个行业只有咨询数据。

图表显示过滤数据。

在此示例中,小型术语部门是标准硬件,显示了在Type是咨询时最大化CLV的最高相关性。

结论

在本单元中,您继续担任主要汽车供应商的运营副总裁。您深入研究了您在爱因斯坦发现数据集成模块中创建的故事。您学会了如何解释爱因斯坦发现在您的数据中发现的几个见解。您查看详细说明所发生情况的描述性见解,并查看比较见解,以显示比较变量时的差异。这个故事充满了关于您的数据的见解。探索故事有助于您发现帐户的CLV与可能影响CLV的其他变量之间的关系。

爱因斯坦发现故事(2)了解发生了什么见解

学习目标

完成本单元后,您将能够:

  • 导航到故事的What Happened见解并探索它们。
  • 查看显示一个变量如何解释结果变量变化的见解。
  • 查看显示双变量组合如何解释结果变量变化的见解。

了解发生了什么见解

注意

注意

本单元中的说明假设您已根据“使用故事获取大图片”中的步骤成功创建了爱因斯坦探索故事,这是此Trailhead模块中的第一个单元。

创建故事后,您看到的第一个见解是What Happened 见解。这些是您故事中的主要见解。它们是描述性的见解,可以帮助您在概览级别上根据对数据集的统计分析来探索导致结果的因素。爱因斯坦发现使用条形图来帮助您可视化发生的事情。

你的故事的结果变量和目标

配置故事时,您告诉Einstein Discovery 在AcquiredAccount数据中最大化变量 CLV。CLV是 您故事中的结果变量,最大化CLV是您的目标。本故事中的所有见解都向您展示了变量和变量组合如何解释CLV的变化。列表中的最高见解反映了结果变量中统计上最显着的变化。

T-测试

对于爱因斯坦分析数据集中的每个类别,爱因斯坦发现执行称为t检验的统计计算,以确定该类别是否具有统计显着性。t检验有助于识别表现出与其他类别在统计上不同的模式的类别。例如,对于名为Naval的类别 ,第一步是将数据拆分为两组:Naval不是Naval。第二步是使用t检验来确定这两组是否在统计学上不同。

查看一阶分析

让我们从查看列表中的第一个洞察开始。

CLV by Division insight
注意

注意

如果这里的图像与您在爱因斯坦发现中看到的屏幕略有不同,请不要担心。界面元素通常是相同的,但一些细节 – 包括它们显示的数据 – 可能略有不同。

根据Einstein Discovery对Einstein Analytics数据集中AcquiredAccount数据的统计分析,Division是解释CLV变化最大的变量。这种类型的洞察,称为一阶分析,检查一个变量(分部)如何解释结果变量(CLV)的变化。

让我们来看看洞察力的不同部分。

解释性文字

洞察力的左侧包括解释性文本。

洞察力的说明文字。

解释性文字包括:

  • 洞察力的标题:CLV by Division
  • 洞察力摘要:分部解释了CLV变异的14.2%。
  • 最重要的观察摘要列表(与图中的蓝色条相关联),其变化具有统计学意义(高于或低于平均值)。

将鼠标悬停在超链接上会突出显示右侧图表中的相关栏。

单击超链接可向下钻取到观察图表中,该图表显示由您的选择过滤的数据。

洞察的过滤数据图表。
注意

注意

单击x以删除过滤器并返回上一屏幕。

这一洞察力的关键在于该部门解释了CLV变异的14.2%。爱因斯坦发现进行了统计计算,以找出确定系数R 2(R平方)。R 2告诉你多少分部解释了结果变量(CLV)的变化 – 换句话说,分区变量有多少预测能力。其他观察描述了影响CLV的其他因素。

图形

洞察力右侧的图像是条形图:

图表的洞察力。

在此图中:

  • CLV是垂直轴, 分区是水平轴。
  • 图表中的橙色水平线显示平均CLV,刚好高于 20K
  • 蓝条表示在平均CLV之上和之下进一步延伸的变量。这些是最有趣的相关性。在这些部门中,原材料和 制图是最高于平均水平的,而标准硬件是最低于平均水平的。
  • 灰色条显示接近平均CLV的变量。这些划分在统计上不太重要,因此未列在左侧的解释性文本中。在考虑灰色条时,您无法得出与其他类别的差异有意义的结论。

将鼠标悬停在栏上查看详细信息

将鼠标悬停在图表中的条形图上可查看弹出的详细信息框。例如,如果将鼠标悬停在 原材料上,则会看到:

将鼠标悬停在图表中的条形图上可查看详细信息。

请注意,当选择蓝色条时,左侧的相应说明文字会突出显示。弹出窗口向您显示分部 为原材料的基础统计详细信息:

  • 与整体的差异显示您在该类别的平均值之上或之下的距离。如果数字为负数,则低于平均值。
  • 总计显示原材料的总CLV 。
  • 平均值是类别中每个值的总和除以值的数量(Count)。
  • 标准偏差可让您了解该类别中的项目与平均值的差异。较小的标准偏差告诉您大多数数字接近平均值。在上面的例子中,原材料类别的标准偏差是8,440。这是一张图像,显示两条具有不同标准偏差的曲线。平均值位于中间,处于峰值。在蓝色曲线中,请注意更多的值更接近平均值。它具有较小的标准偏差。在红色曲线中,值更加分散,因此它具有更大的标准偏差。
两条曲线说明了不同的标准偏差
  • Count是该类别中的事物数量。在这个例子中,我们的原材料部门有417个客户。

让我们探索列表中的下一个洞察力。

查看二阶分析

在Type is Consulting时,向下滚动到标题为CLV by division的洞察。

当Type是咨询洞察时,CLV by Division

这是对前面讨论过的第一个见解的改进,CLV by Division。它增加了第二个变量,当Type为Consulting时,意味着两个变量的组合(CLV是Division和Type是Consulting)给出了强烈的信号。这种类型的洞察,称为二阶深入挖掘,比较多个变量解释结果变量的变化。

请注意,图表中首先突出的是海军上方的蓝色条形图,其中显示当Division为Naval时,咨询是最高的。

当Type是咨询洞察力 - 图表时,CLV by Division

该图表并排显示数据条以进行比较。对于Naval,蓝色条表示Type is Consulting,灰色条表示所有其他类型。

看着解释性文字。正如预期的那样,解释性文本中第一次也是最重要的观察是海军高出6,780。Type is Customer可能会使结果恶化。

当Industry is Retail时,向下滚动到下一个洞察,CLV by Division。它也是一个二阶钻取图,它着眼于双变量组合,分部和行业是零售。这种见解是与分部相关的另一个统计相关模式。

当行业是零售洞察时,CLV by Division

每个师有两个酒吧。左侧的条形图表示仅包含零售行业时的部门平均值。右边的栏表示除零售以外的所有行业的分部平均值。通过比较这些条形,您可以了解此配对的行为有多么不同。

爱因斯坦发现标志着这种洞察力的原因在于,就分部而言,这个特定行业零售业与其他人群的行为不同。在这种情况下,每个柱子指的是工业零售时的分部。当我们将每个部门与其他人口进行比较时,我们将零售行业的这一部门与所有其他行业的部门进行比较。如果这两个组在统计上不同,则条形图以蓝色突出显示。

在图表中,将鼠标悬停在标准硬件蓝色栏上。

行业零售时按部门划分的CLV统计数据 - 标准硬件见解

和以前一样,此框显示有关该类别的总体,总计,平均值,标准差和计数差异的信息。此外,还显示了与常见的差异。在此示例中,当行业为零售时,标准硬件的常用差异为2,450。为什么?因为这是行业零售时标准硬件与所有其他行业标准硬件之间的差异。

现在,向下滚动查看,直到您看到CLV by Type,这是另一个重要的一阶分析。

CLV by Type insight

在划分之后,从统计学角度来看,Type是下一个最具说明性的单一变量。换句话说,Type是第二强的一阶项。

爱因斯坦发现故事(1)用故事来获得大局

学习目标

完成本单元后,您将能够:

  • 打开一个故事。
  • 描述故事中洞察力的呈现顺序。
  • 列出故事为您提供的洞察类型。

介绍

在本单元中,我们深入探讨了一个故事,以了解不同类型的见解以及如何解释它们。想象一下,您是一家大型汽车供应商的运营副总裁,在那里您已经获得了王牌侦探工作的声誉。当您解决爱因斯坦发现基础模块中缩小边距的情况时,执行团队留下了深刻的印象。他们回来了,要求你提供更多帮助。现在,他们想要了解有关帐户的客户终身价值的更多信息。

什么是客户终身价值?

客户终身价值(CLV)是一种指标,用于预测公司与客户关系的整个生命周期内的盈利能力。看CLV可以帮助您找到最好的客户。它可用于查找可能最有利可图的客户群,以便可以为他们分配更多的营销资源。

什么是故事?要查看,爱因斯坦探索故事代表了对您的爱因斯坦分析数据集的全面统计分析。一个故事:

  • 帮助您发现业务相关指标(结果变量)与作为该指标潜在影响因素的解释变量之间的关系
  • 目标是最小化或最大化业务指标(例如,最大化利润或最小化成本)
  • 包含安排在有组织的演示文稿中的答案,解释和建议,其中包含逻辑流程和相关章节
  • 充满了关于您的数据和您感兴趣的变量的见解

让我们创造一个可以使用的故事。

尝试使用Developer Edition Org进行爱因斯坦探索

在您使用此Trailhead模块之前,请注册免费的启用Analytics的Developer Edition组织。这个组织是一个安全的环境,你可以练习你正在学习的技能。

重要

重要

对于此跟踪,您不能使用现有的Developer Edition组织。相反,请注册这个特殊的启用Analytics的Developer Edition组织,因为

  • 它配备了爱因斯坦发现所需的Analytics Plus许可证。
  • 它启用了爱因斯坦发现。
  • 它具有使用爱因斯坦发现功能所需的Einstein Analytics Plus权限集。

即使您已经拥有支持Analytics的开发人员版组织,也请立即注册新版本。较旧的支持Analytics的开发人员版组织不会获得最近发布的功能。注册一个新的确保您获得最新和最好的。

注册?大!让我们跳进去吧!

下载数据

在我们创建此模块中使用的故事之前,我们需要分析数据。下载名为AcquiredAccount.csv的CSV文件并将其保存到您的计算机。

CSV文件的第一行

CSV文件有11列:帐户ID,帐单状态,部门,行业,所有权,评级,类型,AccountScore,StartDate,CloseDate和CLV。CSV文件包含我们汽车零部件制造公司与之合作的10,000家不同公司中的每一家的一行信息。以下是CSV文件的前几行:

创建并填充爱因斯坦分析数据集

下一步是将CSV文件中的数据导入Einstein Analytics数据集。

  1. 在您的新DE组织中,切换到Lightning Experience(如果您还没有这样做)。
  2. 单击App Launcher图标(),搜索Analytics Studio,然后单击磁贴以启动Analytics Studio。注意一定要设置弹出窗口阻止程序以允许弹出窗口。否则,您的已连接应用程序无法启动。
  3. 单击“ 数据集”
  4. 单击“ 创建”,然后从下拉列表中选择“ 数据集 ”。
  5. 选择CSV文件作为新数据的来源。
  6. 在打开的文件选择窗口中,查找并选择(或拖放)您下载的 AcquiredAccount.csv文件,然后单击“下一步”
  7. 接受默认值并单击“ 下一步”
  8. 接受默认值并单击“上载文件”。Einstein Analytics创建数据集并从CSV文件导入数据。

创建故事

现在,您已准备好从此数据集创建故事。首先告诉爱因斯坦发现哪个变量最大化。在本单元中,我们专注于最大化CLV变量。

  1. 将鼠标悬停在数据集上,单击向下箭头,然后单击“ 创建故事”。Analytics Studio启动“故事设置”向导。
  2. 在第一个屏幕中,对于变量,选择CLV作为要使用的结果变量(业务度量)。
  3. 接受所有其他默认值并单击“ 数据选项”
  4. 在“数据选项”屏幕中,接受所有默认值,然后单击“ 审阅设置”
  5. 单击创建故事。当它完成故事的准备时,爱因斯坦发现会向你展示它。
CLV by Division insight

我们故事的见解

故事介绍了爱因斯坦发现为您揭示的见解。您看到的第一个见解是What Happened见解,它是描述性 见解,可以根据数据集中的数据更多地告诉您所发生的事情。

故事中的见解顺序

在洞察列表中,您看到的第一个见解是从统计上解释结果变量中变化最大的那些见解。当您滚动浏览故事时,稍后出现的见解会解释变量,从统计上来说,这些变量可以解释结果变量中较少的变化。在分析开始时,我们不知道因果关系。这些见解向我们展示了统计上显着的模式,这些模式为我们提供了有关在何处挖掘更多细节的线索。当然,您可以按照自己想要的任何顺序自由探索这些见解。

其他类型的见解但这个故事也包含其他类型的见解:

  • 为什么会这样
  • 预测和改进
  • 有什么区别(在预测和改进下拉列表中)

所有这些类型的见解都包含在本单元以及“爱因斯坦发现故事洞察”模块中。

深入了解我们的故事见解

现在您已经了解了故事和见解,让我们深入了解如何充分利用您故事中的每种洞察力。下一个单元探讨了What Happened的 见解。