深入剖析linq的联接

时间：2018-02-07 00:51:06 阅读：169 评论：0 收藏：0 [点我收藏+]

标签：== 求值 query class img 循环 ons strong []

内联接

from a in new List<string[]>{
                            new string[2]{"张三","男"},
                            new string[2]{"李四","女"},
                            new string[2]{"王五","男"}
                            }
join b in new List<string[]>{
                new string[3]{"张三","英语","90"},
                new string[3]{"张三","语文","70"},
                new string[3]{"李四","数学","100"}
                }
    on a[0] equals b[0]
select new {User=a,Score=b}

结果的结构如下

技术分享图片

注意结果里没有a表的“王五”数据

总结：内联接用“join 数据源 on 条件"语法，会将左表（即写在前面的表）的每一条记录和右表（即写在后面的表）的每一条记录进行比较，如果左表有x条记录，右表有y条记录，比较会有x*y次比较，但最后的结果不会有x*y条，而是在x*y条里过滤出符合on条件的记录，有点类似“笛卡尔积+条件判断”的操作。

上面的内联接可完全改成两个from操作（进行笛卡尔积求值），结果的结构是完全一样的

from a in new List<string[]>{
                            new string[2]{"张三","男"},
                            new string[2]{"李四","女"},
                            new string[2]{"王五","男"}
                            }
from b in new List<string[]>{
                new string[3]{"张三","英语","90"},
                new string[3]{"张三","语文","70"},
                new string[2]{"李四","100"}
                }
    where a[0]==b[0]
select new {User=a,Score=b}

写到这，可能会问，那所有的内联接操作都改成几个from表就行，还用得着join on的内联接吗？答案是内联接比单纯对几个表进行笛卡尔积求值“效率高很多”，假设有a,b,c三个表，分别为x,y,z条记录，如果用笛卡尔积算法（linq代码如：from a in tab_a from b in tab_b from c in tab_c where ...... select ....），一共会进行x*y*z次连接操作，并对x*y*z条记录进行where过滤；但如果用内联接（linq代码如：from a in tab_a join b in tab_b on ... join c in tab_c on ... select ....），每一次的内联接会基于上一次的结果来进行下一次的操作，即a表和b表进行x*y次操作后，最后可能只得出w条记录（此时的w可能远小于x*y），然后再对c表进行w*z次操作，两者比较x*y*z可能远大于w*z。如果不是a,b,c三个表，而是更多的表进行联接，效率就差距很大了。

组联接

from a in new List<string[]>{
                            new string[2]{"张三","男"},
                            new string[2]{"李四","女"},
                            new string[2]{"王五","男"}
                            }
join b in new List<string[]>{
                new string[3]{"张三","英语","90"},
                new string[3]{"张三","语文","70"},
                new string[3]{"李四","数学","100"}
                }
    on a[0] equals b[0] into b_group
select new {User=a,Score=b_group}

结果结构

总结：内联接用“join 数据源 on 条件 into 新数据源"语法，会以左表（即写在前面的表）的每一条记录为一组，分别和右表（即写在后面的表）的每一条记录进行比较，如果左表有x条记录，右表有条记录，比较会有x*y次比较，但结果只有x组，而每一组可能有<=y条>=0条记录。

如果要对上面的代码进行输出操作，会有两次循环操作

var query=from a in new List<string[]>{
                            new string[2]{"张三","男"},
                            new string[2]{"李四","女"},
                            new string[2]{"王五","男"}
                            }
join b in new List<string[]>{
                new string[3]{"张三","英语","90"},
                new string[3]{"张三","语文","70"},
                new string[3]{"李四","数学","100"}
                }
    on a[0] equals b[0] into b_group
select new {User=a,Score=b_group};

foreach(var p1 in query){
    Console.WriteLine($@"{p1.User[0]}的成绩如下：");
    foreach(var p2 in p1.Score){
        Console.Write($@"---{p2[1]}-{p2[2]}---");
    }
    Console.WriteLine();
}

结果输出如下：

张三的成绩如下：
---英语-90------语文-70---
李四的成绩如下：
---数学-100---
王五的成绩如下：

可以发现，单是用组联接其实返回的结果在有此情况下是不方便进行处理的，因为要对每一个组再进行循环才能取到我们最终想要的值，下面介绍用“内联接+组联接”来方便的得到我们想要的值

内联接+组联接

代码如下

from a in new List<string[]>{
                            new string[2]{"张三","男"},
                            new string[2]{"李四","女"},
                            new string[2]{"王五","男"}
                            }
join b in new List<string[]>{
                new string[3]{"张三","英语","90"},
                new string[3]{"张三","语文","70"},
                new string[3]{"李四","数学","100"}
                }
    on a[0] equals b[0] into b_group
from b2 in b_group
select new {User=a,Score=b2}

结果的结构如下：

技术分享图片

如果细心的朋友会注意到现在的结果和最前面“内联接”一节的结果是一样的。

对代码稍作修改

from a in new List<string[]>{
                            new string[2]{"张三","男"},
                            new string[2]{"李四","女"},
                            new string[2]{"王五","男"}
                            }
join b in new List<string[]>{
                new string[3]{"张三","英语","90"},
                new string[3]{"张三","语文","70"},
                new string[3]{"李四","数学","100"}
                }
    on a[0] equals b[0] into b_group
from b2 in b_group
select new {User=a,Score=b_group}

只是将

select new {User=a,Score=b2}改成了

select new {User=a,Score=b_group}

结果的结构变成如下

技术分享图片

左外联接

代码如下

from a in new List<string[]>{
                            new string[2]{"张三","男"},
                            new string[2]{"李四","女"},
                            new string[2]{"王五","男"}
                            }
join b in new List<string[]>{
                new string[3]{"张三","英语","90"},
                new string[3]{"张三","语文","70"},
                new string[2]{"李四","100"}
                }
    on a[0] equals b[0] into temp
from b in temp.DefaultIfEmpty()
select new{User=a, Score=b}

结果如下

技术分享图片

代码稍作修改

from a in new List<string[]>{
                            new string[2]{"张三","男"},
                            new string[2]{"李四","女"},
                            new string[2]{"王五","男"}
                            }
join b in new List<string[]>{
                new string[3]{"张三","英语","90"},
                new string[3]{"张三","语文","70"},
                new string[2]{"李四","100"}
                }
    on a[0] equals b[0] into temp
from b in temp.DefaultIfEmpty()
select new{User=a, Score=temp}

结果的结构变成

技术分享图片

深入剖析linq的联接

标签：== 求值 query class img 循环 ons strong []

原文地址：https://www.cnblogs.com/shengyu-kmust/p/8424427.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行